2016-11-22 78 views
1

CoreNLP比我們期望得到的三倍多,即整個句子或短語,而不是一個或兩個構成句子傳達的基本或基本信息的三元組。斯坦福大學CoreNLP的回報超過基本關係三元組

例如,在句子:

「的初步診斷是在 16:00 CDT上11/11/2011通知湯姆博士由Roy大隊MD。」

我們預計這三重:

preliminary diagnosis; be notify to; Dr. Tom 

但我們得到三元這樣的:

1.0 diagnosis be notify by Roy Coy MD at 16:00 cdt on 11/11/2011 
1.0 diagnosis be notify to Dr. Tom at 16:00 cdt on 11/11/2011 
1.0 preliminary diagnosis be notify to Dr. Tom 

它除了基本的信息包含額外的細節。在極端情況下,CoreNLP返回整個原始句子。

爲了將CoreNLP輸出減少到基本三元組,我們可以改變什麼參數?我們已經嘗試了最大數量的蘊含和三重嚴格集合,但它們不起作用。我們可以提供一個包含三元組完整列表的文件。

Java代碼:

java -mx1g -cp stanford-openie.jar;stanford-openie-models.jar;slf4j-api.jar edu.stanford.nlp.naturalli.OpenIE -openie.max_entailments_per_clause= 1 -openie.triple.strict= true -openie.splitter.disable=true 
+0

歡迎來到Stack Overflow!請查看我們的[SO問題清單](http://meta.stackoverflow.com/questions/260648/stack-overflow-question-checklist)來幫助你提出一個好問題,從而得到一個很好的答案。 –

回答

0

這是,實際上,通過設計。事先並不總是清楚OpenIE系統中人們希望的粒度級別,因此我們的系統試圖產生它所能達到的所有粒度級別。這裏的預期用途是生成可以在數據庫中查找的三元組。所以,如果有人要求一個非常具體的查詢,則返回更長的三元組。如果有人問一個簡單的查詢,我們返回簡單的三元組(並且沒有關係,在那裏有一些更長的元素)。