2010-05-16 92 views
-1

我已經計算了文檔1和文檔2的術語的tf-idf值..現在我不知道如何使用這些tf-idf值...基本上我想找到兩個文檔之間的相似度(in我的情況是網頁)..可以任何機構告訴如何實現餘弦相似性,jaccard係數找到相似性... c#代碼將不勝感激。請幫助...謝謝餘弦相似性問題

回答

0

我建議訪問Apache Mahout。它爲此提供了一套完整的工具。即使你不想使用它們,你也可以通過查看現有的實現來獲得這些問題的答案。

+0

感謝您的回覆....你能給我的鏈接 – jaskirat 2010-05-16 18:12:27