2016-09-19 201 views
0

我已經使用了Standford NLP來識別給定句子的POS。NLP從句子提取字典單詞

我需要從句子中只提取正確的單詞(詞典中定義的單詞)。

對於例如:如果一句話就是「我去紐約的航班6AWDR

當我使用斯坦福NLP,都寫着「飛行」和「6AWDR」被標記爲PartOfSpeechAnnotation.class的「NNP」。

如何在一個句子中單獨提取適當的英語單詞?

回答

0

我已經使用Apache Utils來識別字符串是否爲Alpha。

假設是大多數字母數字單詞在字典中將不是有效單詞(除非它們是縮寫)