我使用NLTK WordNet Lemmatizer進行詞性標註項目,方法是首先將訓練語料庫中的每個單詞修改爲詞幹(就地修改),然後僅對新語料庫進行訓練。但是,我發現lemmatizer沒有按照我的預期運行。NLTK WordNet Lemmatizer:難道它不應該將一個詞的所有變化詞彙化?
例如,字loves
被lemmatized到love
這是正確的,但這個詞loving
甚至詞形還原後仍loving
。這裏loving
就像在「我愛它」這句話中一樣。
是不是love
變形詞的詞幹loving
?同樣,許多其他'ing'形式仍然存在,就像它們在詞形化之後一樣。這是正確的行爲?
什麼是一些準確的其他lemmatizers? (不必在NLTK中)在決定詞幹時,是否有詞法分析器或詞法分析器也考慮到單詞的詞性標記?例如,如果killing
用作動詞,則詞killing
應該具有kill
作爲詞幹,但如果它用作名詞(如在the killing was done by xyz
中),則它應該具有killing
作爲詞幹。
感謝您的回答!你還可以告訴,它需要的是什麼標籤? n-nouns,v =動詞...? – 2015-09-06 21:53:02