2012-04-18 42 views
2

我基本上創建了一個搜索引擎,我想實現tf * idf來根據搜索查詢對我的xml文檔進行排名。我如何實現它?我如何開始它?任何幫助讚賞。java -tf * idf的實現?

+0

這可能有助於作爲出發點http://stackoverflow.com/questions/1960333/any-tutorial-or-code-for-tf-idf-in-java – Danny 2012-04-18 13:55:16

回答

1

我過去是這樣做的,我用Lucene來獲取TD * IDF數據。

儘管它花費了相當多的費用,所以如果有其他解決方案的人知道更容易,然後使用它們。

先看TermFreqVectororg.apache.lucene.index其他班級。

1

tfidf是一個計算Tf-Idf的獨立Java包。