2015-04-02 85 views
-1

使用stanford我想在做pos標記後在我的句子中得到所有的形容詞。我嘗試了一些方法並且沒有工作。有沒有什麼方法可以從句子中得到所有的形容詞(JJ)。可能已經有這樣的問題了,但我沒有找到正確的答案。在pos標記後提取形容詞

 MaxentTagger tagger = new MaxentTagger("taggers/left3words-wsj-0-18.tagger"); 
     String sample = "feeling happy"; 
     String tagged = tagger.tagString(sample); 
System.out.println(tagged); 

     output : feeling/VBG happy/JJ 

回答

0

您需要首先標記句子,然後您將在一對(詞,詞性標記)對中包含一個字符串列表,因爲您只需要詞性標記,您可以通過循環將其過濾掉在你的語料庫中的所有單詞。 這裏是它是從語料庫

file=open(product_name,'w'); 
bags=nltk.bigrams(tagged_sentences) 
distribution = nltk.FreqDist(bags) 
c = Counter(distribution) 
for k,count in c.most_common(): 
    if ((k[0][1])=='JJ')): 
    do something... 

上面的代碼是在Python過濾形容詞了Python代碼的一小段,所以我希望你不會覺得很難看。第一行打開文件,第二行標記語料庫中的所有單詞。 c返回的列表格式爲[(word,tag),(word,tag)....],所以你必須檢查列表的每一個第二個索引,如果它匹配'JJ',你可以過濾它。