2013-03-22 71 views
0

我剛剛學習使用Python的nltk。我正在使用POS標記。我想知道的是如何使用標籤。例如,這是僞代碼:檢查Nltk POS標籤

words = [] 
teststr = "George did well in the test." 
tokens = nltk.word_tokenize(teststr) 
words = nltk.pos_tag(tokens) 

我想要做這樣的事情:

if words[i] == "proper noun": 
    #do something 

如何檢查一個單詞是否是名詞或動詞或語音的任何其他部分。 有人可以幫我在這裏嗎? 謝謝。

回答

2

如果你看看你是返回以下列表中pos_tag函數調用的結果:

[('George', 'NNP'), ('did', 'VBD'), ('well', 'RB'), ('in', 'IN'), ('the', 'DT'), ('test', 'NN'), ('.', '.')] 

如果您遍歷清單基礎上的價值是你所需要的一個專有名詞做一些事情以下代碼:

if words[i][1] == 'NNP': 
    # do something 

NNP是一個單數專有名詞。該列表中的每個條目都是一個元組,第一個值是單詞,第二個值是pos。

+1

非常感謝瑞恩!我現在明白了。對不起,沒有聲望,所以不能upvote。 – user2201130 2013-03-22 23:34:31