2010-11-11 83 views

回答

2

有兩種選擇我能想到的把我的頭頂部:

選項之一是遍歷樣本POS標記的語料庫,只是自己構建這個映射。這會爲您提供與語料庫中特定單詞關聯的POS標籤。

選項二是在語料庫上建立隱馬爾可夫模型POS標記器,然後檢查模型的值。這爲您提供了與語料庫中特定單詞相關聯的POS標籤以及其先驗概率,以及其他一些統計數據。

根據你的用例是什麼,可能會比另一個更好。我會從選項一開始,因爲它快速而簡單。

0

這可能是你正在尋找:

from nltk.corpus import wordnet 

add = wordnet.synsets('add', 'v') 

add 
>>> 
[Synset('add.v.01'), 
Synset('add.v.02'), 
Synset('lend.v.01'), 
Synset('add.v.04'), 
Synset('total.v.02'), 
Synset('add.v.06')] 

lemma = add[0].lemmas[0] 

lemma 
>>> Lemma('add.v.01.add') 
lemma.derivationally_related_forms() 
>>> [Lemma('addition.n.02.addition'), Lemma('linear.a.01.additive')] 
相關問題