用CoreNLP爲法語解析依賴項

我正在嘗試將Stanford CoreNLP用於法語文本。 POS標記和解析工作正常，但對於我的配置，輸出依賴關係根本沒有意義。用CoreNLP爲法語解析依賴項

我的命令是

java -mx1g -cp "~/stanford-corenlp/stanford-corenlp-full-2015-12-09/*" 
edu.stanford.nlp.pipeline.StanfordCoreNLP -props french.conf 
-file /tmp/file.txt -outputFormat text

其中french.conf包含：

annotators = tokenize, ssplit, pos, depparse, parse 
tokenize.language = fr 
pos.model = edu/stanford/nlp/models/pos-tagger/french/french.tagger 
parse.model = edu/stanford/nlp/models/lexparser/frenchFactored.ser.gz 
depparse.model = edu/stanford/nlp/models/parser/nndep/UD_French.gz

我使用CoreNLP 3.6與法國模型中發現here。日誌看起來很好與尊重：

[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator tokenize 
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator ssplit 
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator pos 
Reading POS tagger model from edu/stanford/nlp/models/pos-tagger/french/french.tagger ... done [0,2 sec]. 
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator depparse 
Loading depparse model file: edu/stanford/nlp/models/parser/nndep/UD_French.gz ... 
PreComputed 100000, Elapsed Time: 1.43 (s) 
Initializing dependency parser done [3,4 sec]. 
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator parse 
[main] INFO edu.stanford.nlp.parser.common.ParserGrammar -  Loading parser from serialized file edu/stanford/nlp/models/lexparser/frenchFactored.ser.gz ... 
done [3,0 sec].

但這裏是「樂聊天奶源LA蘇里斯」（貓吃了老鼠，具有完全相同的結構）

root(ROOT-0, chat-2) 
det(chat-2, Le-1) 
case(souris-5, mange-3) 
det(souris-5, la-4) 
nmod:mange(chat-2, souris-5) 
punct(chat-2, .-6)

結果

這只是無稽之談;這並不例外，我測試了很多句子，總是得到這種輸出。這就是爲什麼我想我正在使用一個錯誤的配置文件。

任何幫助，將不勝感激！

來源

2016-04-14 jpl

您是否找到解決方案？ @jpl – zwlayer

這是因爲CoreNLP依賴分析器希望得到輸入Universal Dependencies POS標籤和由CoreNLP提供的法國POS tagger輸出法語Treebank的POS標籤。

我做了法國的POS惡搞輸出轉換，以獲得通用的依賴POS標籤補丁：https://github.com/askplatypus/CoreNLP/commit/e6215bdc5d4903bc3e2d2fb533da7e3938fa825f

來源

2016-09-16 13:26:33 Tpt

對於那些有興趣，斯坦福CoreNLP現在已經更新了他們的模型，他們工作得很好現在。

來源

2017-04-14 07:39:45 jpl

用CoreNLP爲法語解析依賴項

回答

相關問題