給定一個單詞如「table」,我想確定它最常用的名稱,它最常用的用法是名詞,動詞還是形容詞。我想在python中做到這一點。除了wordnet以外還有其他的東西嗎?我不喜歡wordnet。或者,如果我使用wordnet,我將如何完全使用它?將單詞識別爲名詞,動詞或形容詞
0
A
回答
5
import nltk
text = 'This is a table. We should table this offer. The table is in the center.'
text = nltk.word_tokenize(text)
result = nltk.pos_tag(text)
result = [i for i in result if i[0].lower() == 'table']
print(result) # [('table', 'JJ'), ('table', 'VB'), ('table', 'NN')]
4
如果你有一個詞斷章取義,想知道它最常見的用途,你可以看看別人的頻率表(例如共發現),或者你可以做自己的罪狀:只要找到一個標籤足夠大的語料庫用於您的目的,並計算其實例。如果你想使用免費的語料庫,NLTK包括布朗語料庫(100萬字)。 NLTK還提供了處理較大的非自由語料庫(例如英國國家語料庫)的方法。
import nltk
from nltk.corpus import brown
table = nltk.FreqDist(t for w, t in brown.tagged_words() if w.lower() == 'table')
print(table.most_common())
[('NN', 147), ('NN-TL', 50), ('VB', 1)]
相關問題
- 1. 單詞的名詞,動詞,形容詞等的單獨列表
- 2. 名詞,動詞,形容詞等的單詞列表
- 3. 將形容詞和副詞轉換爲名詞形式
- 4. 創建詞的其他形式[名詞,形容詞,複數,動詞..一切]
- 5. Perl模塊查找單詞是否是動詞/名詞/形容詞/文章/介詞
- 6. 如何命名爲形容詞或介詞的Rails資源?
- 7. 從名詞詞組獲得動詞python
- 8. 爲「High Score」建議的動詞/名詞
- 9. POS tagging - NLTK認爲名詞動詞
- 10. 在Python3與nltk如果某個單詞是動詞,如果某個單詞是動詞,名詞.etc
- 11. 將單詞替換爲除Python中的名詞和形容詞之外的特殊字符串
- 12. 使用詞網找到沒有名詞同義詞或至少有一個名詞同義詞的詞條
- 13. 單詞列表的詞形化
- 14. 接口命名爲形容詞
- 15. 分割的正則表達式 - 將單詞拆分爲詞素或詞綴
- 16. 如何自動將單詞列表替換爲單詞文檔?
- 17. 如何將長單詞分成單詞?
- 18. 從WordNet獲取名詞和形容詞列表
- 19. Marklogic值詞典和單詞詞典
- 20. 用空格作爲單詞間的分隔符移動單詞中的單詞
- 21. J,不易動詞動詞
- 22. Lucene:多詞詞組作爲搜索詞
- 23. UIWebview字詞識別器
- 24. 策略識別專有名詞NLP
- 25. 使用Quanteda Corpuses識別名詞
- 26. HashFunction爲「單詞」
- 27. wikionary API - 單詞的詞義
- 28. NLTK單詞詞性標註
- 29. 尋找單詞解析的網站,告訴如果一個單詞是一個名詞,動詞等
- 30. Django模型 - 將詞組鏈接到詞典/詞典中的單個詞
您需要詞性標記(http://www.nltk.org/book/ch05.html)。 – Vidul
Wordnet對於一個詞的每個* sense *有一個頻率(例如'table')。但是自2003年以來這一點並沒有得到更新(據我所知)。更好的選擇是下載Google n-grams並在該數據集上進行POS標記。 –
你打算如何使用POS標籤5字ngrams?這個想法是沒有開始的。但谷歌確實提供了由第一個詞的POS分類的[ngram文件](http://storage.googleapis.com/books/ngrams/books/datasetsv2.html),所以這將是一種廣泛計數的方法。如果你有磁盤空間,並真的需要通過這麼多的數據。 – alexis