2017-05-30 40 views
1

作爲一個新手,NLP和spaCy發言,我想能夠確定,如果語句描述的狀態(被)或一個動作。如何區分描述狀態VS行動

在spaCy的一個簡單的測試,我認爲用在動詞的引理」屬性將有助於表明這一點。我試了下面兩句話。

1)我是Netflix的訂戶 給這些令牌結果: 我 - PRON AM - 動詞 一個 - DET Netflix的 - 名詞 用戶 - 名詞

和引理動詞 'AM'被賦予作爲u'be」

2)我瀏覽到 起始頁給這些令牌結果: 我 - PRON 導航 - 動詞 到 - ADP 的 - DET start - NOUN page - NOUN

並且動詞'navigate'的引理是作爲u'be'給出的。

所以依靠引理將無法正常工作。上面的例子會起什麼作用?一般?

感謝您的期待。

科林·戈德堡

回答

0

望着這(多)後來,我又測試了第二份聲明 - 孤立。

即。 聲明: 「我瀏覽到起始頁」

doc = nlp(u'I navigate to the start page') 
for token in doc: 
    print('{} - {}'.format(token, token.pos_)) 
I - PRON 
navigate - VERB 
to - ADP 
the - DET 
start - NOUN 
page - NOUN 

t = doc[1] 
t.lemma_ 
u'navigate' 

即。現在我可以在這兩個語句之間區分 - 在我的客觀方面 - 通過使用lemma_功能。

所以我之前遇到的問題是,在測試第二條語句之前,doc的內容沒有被清除。我已經看到了這之前到來,但我沒有。與此同時,對doc的第二次賦值(即doc = nlp(u'I導航到開始頁'))不會覆蓋之前的值 - 這對我來說並不明顯。

感謝您閱讀本文。

科林戈德堡