我有一個產品,讓我們說一本書。現在我想要檢索與此產品相似的k個產品。我怎樣才能用Mahout做到這一點?如何使用Mahout獲得k個類似的產品?
產品存儲在MySQL數據庫中,所以我會使用JDBCDataModel。 爲了計算相似性,我更喜歡LogLikelihoodTest。
但我應該選擇哪個推薦人?似乎所有的推薦人都是設計的
我有一個產品,讓我們說一本書。現在我想要檢索與此產品相似的k個產品。我怎樣才能用Mahout做到這一點?如何使用Mahout獲得k個類似的產品?
產品存儲在MySQL數據庫中,所以我會使用JDBCDataModel。 爲了計算相似性,我更喜歡LogLikelihoodTest。
但我應該選擇哪個推薦人?似乎所有的推薦人都是設計的
我想在這裏猜這個問題。你有用戶項目數據,用戶是真實的人,項目是書籍。您正在使用LogLikelihoodSimilarity
作爲推薦人的基礎,無論是基於用戶還是基於項目。
如果你只是想要最相似的物品,你不需要推薦人。只需使用LogLikelihoodSimilarity
(ItemSimilarity
)計算與所有其他項目的相似度並採取最相似的項目。實際上看看TopItems
這個類,它甚至爲你做了這個邏輯。
設計...?完成這個想法,我敢肯定我可以回答。 – 2012-01-09 18:38:32
對不起,它是在說「所有推薦人都是爲了與用戶數據一起使用而設計的」。 – brainfck 2012-01-09 22:42:16