2012-01-19 25 views
0

自從早上我已經閱讀了很多教程。我的問題涉及找到兩個文件之間的相似性。我期待在java中使用LSA來達到這個目的。LSA - 找到SVD後的步驟

我明白朮語 - 文檔矩陣的創建,然後將SVD(維度得到降低)應用於它。 3矩陣是作爲results.This聽起來可能聽起來很愚蠢,但我一直堅持了這一段時間。現在,如果我必須找到兩個文件之間的相似性,我該怎麼辦?

+0

因爲我只比較兩個文檔,使用LSA會有好處嗎? – CTsiddharth

回答

0

使用SVD計算3個矩陣後,您需要計算要比較的兩個文檔的向量之間的相關性。你可以使用spearman的相關性。 另一種方法是使用餘弦距離。

你會在LSA找到更多的細節,有一個完整的例子與解釋。

您可能會搜索一些用於LSA的java庫。

+0

嗨,我最近遇到此鏈接。 http://www.miislita.com/information-retrieval-tutorial/svd-lsi-tutorial-4-lsi-how-to-calculations.html。這種方法似乎很簡單,完美地滿足了我的目的 – CTsiddharth