2016-02-26 133 views
0

如果我使用Stanford CoreNLP神經網絡依賴分析器與英語_SD模型,根據網站(link, bottom of the page)表現相當不錯,它提供了完全不同的結果相比,這demo,它我假設是基於LexicalizedParser(或至少是其他任何一個)。斯坦福分析器輸出不匹配演示輸出

如果我把句子我不喜歡在演示頁面汽車,這是結果:

enter image description here

如果我把同一個句子到神經網絡分析器,它結果在此:

enter image description here

在神經網絡分析器的結果,一切都只是依賴等。我認爲這可能是由於POS-Tags不同,但我使用CoreNLP Maxent Tagger和英語雙向distsim.tagger模型,所以我覺得這很常見。對此有何想法?

回答

2

默認情況下,我們使用english-left3words-distsim.tagger模型的tagger比雙向模型快,但偶爾會產生更差的結果。因爲在演示頁面上使用的選區解析器和您使用的神經網絡依賴解析器都嚴重依賴於POS標籤,所以不同的POS序列導致不同的解析並不奇怪,特別是當主動詞有函數詞標記(IN = prepositionon)而不是內容詞標記(VB =動詞,基本形式)。

還要注意的是,演示輸出依賴解析在Universal Dependencies新表示,而english_SD模型分析句子老斯坦福依賴表示。對於你的例句,正確的解析實際上是相同的,但你會看到其他句子的差異,特別是如果他們在新的表示中有不同的介詞短語。

+0

你知道哪個posgerger和哪個模型用於演示頁面嗎?我發現很多使用神經網絡解析器的解析,其中一切或至少非常依賴於一個單詞,這是不正確的... –

+0

我很確定它是'english-left3words-distsim.tagger'模型。如果你正在解析簡短的句子,那麼這似乎不太可能,一切或幾乎一切都取決於主要動詞。 –

+0

是的,你說得對。無論如何,其實第二個pos標籤對我來說更有意義。感謝您的幫助和信息! –