2010-01-14 47 views
8

我正在爲我正在進行的項目尋找各種NLP工具,現在我發現了最有用的斯坦福大學自然語言處理項目。自然語言解析工具:那裏有什麼,什麼不是?

有誰知道是否還有其他工具可以用於語言擴展嗎?

更重要的是,有沒有工具不在那裏?

最特別,我在找一個API,用於morphophoneme分析等

編輯:我是一個學術(學生在課題的研究)和我主要是尋找開源,或者至少,打開api項目。

+0

我之前問過一個更具體的問題,但是這個問題取代了它。 – 2010-01-14 03:01:13

+4

請指出您是否只對免費的東西感興趣,或者如果您是學術型的。我們中的一些人出售這種東西,但我們知道對學者很好。 – bmargulies 2010-01-14 03:20:00

回答

6

我建議你看看下面的例子:

  1. 的ususal NLP庫,例如Open NLPLingPipeNLTKGateUIMA。所有這些提供解析器和詞幹(即它們不會讓你回到詞的根源,但它的詞根)。有些人還提供lemmatizers。
  2. 收集NLP工具的網站。這些只是其中的幾個:計算語言學,Language Technology World協會的wikithe website of the compling dep. at Heidelberg University

我不知道一個工具,它返回一個詞的詞根的,但是,正如我所說,有stemmers和lemmatizers。對於詞形變化,請嘗試Tree TaggerMorpha。 Morphophonemic分析是一個術語,不足以讓你得到你想要的。

一旦您更具體地瞭解您需要什麼,您可以搜索Corpora List的檔案或在那裏發佈問題。

3

NTLK是一個有趣的工具包,它允許構建基於NLP的應用程序。這可以用於需要例如POS標記或實現簡單分類器或實體提取器的實際應用。

但是,我不確定什麼是「語言版本」,但是這聽起來像是可能超出基於NLTK的[容易]的東西。
完全解讀這個問題,並且它對morphophonics的提及似乎證實了NLTK可能不會很好地滿足OP的目的;就我所知,NTLK不提供處理文本的模塊。不過,你可能想自己檢查一下,因爲NLTK是一個廣泛和活躍的項目,並且可能在這個領域看到了最近的增加。

1

Maluuba剛剛向他們的自然語言處理器發佈了一個API。它可在http://developer.maluuba.com

有三個庫由Maluuba爲它寫:

Python庫:https://github.com/maluuba/napi-python

Ruby庫:https://github.com/maluuba/napi-ruby

Java庫:https://github.com/maluuba/napi-java

對於它的威力的例子,以此查詢爲例可以提取:

>> client.interpret phrase: 'Set up a meeting with Bob tomorrow \ 
      night at 7 PM to discuss the TPS reports' 
=> 
    {:entities=> 
     { 
     :daterange=>[{:start=>"2012-11-15", :end=>"2012-11-16"}], 
     :title=>["meeting to discuss the tps reports"], 
     :timerange=>[{:start=>"12:00:00AM", :end=>"12:00:00AM"}], 
     :contacts=>[{:name=>"bob"}] 
     }, 
    :action=>:CALENDAR_CREATE_EVENT, 
    :category=>:CALENDAR 
    }