我是一名文學研究生,我一直在閱讀O'Reilly出版的自然語言處理書(nltk.org/book)。它看起來非常有用。我已經在第1章中討論過所有示例文本和示例任務,例如協調一致。我現在知道莫比迪克用了多少次「鯨魚」。問題是,我無法弄清楚如何在我自己的文本中進行這些計算。我找到了關於如何創建自己的語料庫的信息(O'Reilly書第2章),但我不認爲這正是我想要做的。換句話說,我希望能夠做到如何從文本文件創建我自己的NLTK文本?
import nltk
text1.concordance('yellow')
,並得到這裏所說的「黃」在我的文字使用的地方。目前我可以用示例文本來做到這一點,但不是我自己的。
我很新的蟒蛇和編程,所以這個東西是非常令人興奮的,但非常混亂。
優秀。我只是想自己回答這個問題;很高興我偶然發現了你的(自己)答案。 - 另一種文學學者 – cforster
這個工作,我首先需要下載「PUNKT」: nltk.download(「PUNKT」) –
什麼茹呢? 找到了: f = open('myfile.txt','rU')#rU表示「讀取」,並處理行結束 – ProfVersaggi