2012-03-24 55 views
9

我知道以下開源工具,但我還沒有發現它們分別有多好的比較。 工具與準備使用短語提取:現在哪種語言提取工具是現在的藝術?

  • KEA
  • MAUI(http://code.google.com/p/maui-indexer/)
  • 龍,XTRACT(HTTP://龍.ischool.drexel.edu/xtract.asp)
  • Lingpipe(http://alias-i.com/lingpipe/demos/tutorial/interestingphrases/read-me.html)
  • Mahout(https:// cwiki .apache.org/MAHOUT/collocations.html)
  • 其他

有沒有人見過這樣的比較?

+0

與「短語提取」,你的意思是「句分裂」或「句斷詞」? – Renaud 2012-04-17 10:58:31

回答

0

我喜歡Mallet,因爲它有一個命令行工具,是很容易使用

+0

如何用短槌提取短語?即有話題建模=聚類,但正如我所知,沒有從大型公司提取關鍵短語 – yura 2012-03-28 00:07:36

+0

你是對的,對不起,我在想話題蹣跚 – 2012-03-28 23:28:14

4

MAUI優於KEA在我的實驗。 對無監督自動關鍵短語提取方法進行了比較(Coling 2010論文)。但他們不分析監督方法,我計劃在不久的將來這樣做。另外,我還探索了一套更豐富的功能,這些功能改進了自動關鍵詞抽取的性能,這個功能仍然很不完美。我可能會在明年推出擴展版本的MAUI。

請閱讀以下文章或發郵件給我更多的細節:

Supervised Topical Key Phrase Extraction of News Stories using Crowdsourcing, Light Filtering and Co-reference Normalization

Keyphrase Cloud Generation of Broadcast News

相關問題