2012-04-27 97 views
7

我想知道在Java中是否存在可以定義單詞並找到單詞的起源的API。我記得有一段時間找回了這個,看到「apache commons」,但我不確定。使用Java定義單詞

因此,基本上,用戶將能夠輸入一個詞「溢出」,然後程序將能夠定義這個詞。所以我正在尋找一個可以定義單詞和查找單詞來源的API。所以「recherche」這個詞的起源就是「法國」。

+1

您是否在尋找[引理(HTTP ://en.wikipedia.org/wiki/Lemma_%28morphology%29)的標記?你的問題有點含糊,你應該澄清你的後面 - 最好是用一個例子。 – amit 2012-04-27 14:45:09

+0

我補充說明。希望這個問題將不太模糊 – 2012-04-27 14:49:06

+1

Recherche也是一個德語單詞,你應該意識到同一個單詞可以以多種語言存在 – oers 2012-06-12 06:40:47

回答

8

WordNet會給你一半你正在尋找的東西:你可以查找一個詞的定義。請注意,有幾種WordNet for Java的實現:jwi,jaws,Dan Bikel's,WordnetAPI。其中一些可能更容易用於您的目的比jwordnet由miku(我只使用下巴jwi)建議。

注意:WordNet不會給你起源(AFAIK)。我不知道有這樣的軟件。

:你必須提供一個詞的引理要能看它在字典中。這意味着如果您想在自由文本文檔(可以包含變形表單)上自動執行此操作,則必須應用一些自然語言處理(NLP)技術。如果你走這條路線,我會建議GATE項目的Morph plugin

4

沒有爲詞源網站:http://www.etymonline.com/

它給出結果: RECHERCHE 1722,從神父recherché「仔細尋找,」rechercher頁「尋求。」常用19c。食物,風格等,來表示晦澀難懂的卓越。

不知道他們是否有API,但使用某種腳本來查詢它。

因此找到一個檢測「Fr.」的好方法。在上面的句子中。

乾杯, 埃裏克

2

你有沒有找JWKTL

「維基是一個多語種的,基於Web的,免費的字典,辭典 和短語手冊,設計爲詞法伴侶 維基百科。最近,它已被認爲是自然語言處理應用前景的詞彙 語義資源。」

利用這一點,你可以看到詞的詞源。