2017-04-13 64 views
0

我正在研究一個項目,我正在嘗試做一些研究。我希望能夠使用特定的語料庫庫找到單詞的搭配。我希望有一些SDK可以用來做這種類型的工作。我看着這個選項:創建與特定語料庫的搭配

https://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/trees/CollocationFinder.html

,發現了一個名爲CollocationFinder類,但無法找到太多的文件或不知道是否有指定文集的方式。

我還發現一個名爲JXtract(http://definingterms.com/projects/Champollion/#smadja93)的項目,但它看起來很老,作者聲明它肯定會有錯誤。

是否有人知道我可以用來開發軟件的好庫?什麼可以選擇語料庫,還可以選擇不同的方法來確定搭配?

+0

我對NLP並不熟悉。但是,考慮到我還沒有收到任何答覆,我想知道如果我的問題沒有意義?或者,也許這是使用當前軟件庫無法完成的事情? – jason

+0

*「我對NLP不熟悉」。*鑑於您對[tag:jnlp]等標籤的有用代碼彈出窗口的關注度,我並不感到驚訝。 –

回答

0

由於您沒有指定它必須是Java解決方案,因此有a collocationand a concordancerapp built using NLTK (Python)。它符合你的要求(一個好的圖書館[用於NLP],允許[s]選擇一個語料庫,你自然可以編碼任何不同的方法來確定搭配 - NLTK中的TK代表「工具包」!)

+0

是的,這不必在Java中完成。感謝您的建議。我會檢查這一個。 – jason

0

Stanford CoreNLP中CollocationFinder類的用途是將單詞合併成單個搭配標記。這些搭配可以從WordNet中找到,所以這個類不會幫助從一個語料庫中提取自動搭配。