2012-03-01 53 views
1

我需要一種方法或一種算法預先計算基於他鳴叫的用戶興趣 ..預先計算出用戶感興趣的

用戶用他的Twitter帳戶連接他的帳戶和檢索他的鳴叫後首次以該用戶繼續使用我的系統我將不得不做出這些預測更準確,我將不得不預先計算他的口味和興趣..

..

是有一個算法或數學模型 這將有助於這一要求?

請提供 - 現有研究的鏈接或開放的源代碼或例子,這將有助於我上手..

回答

2

您可以使用Machine-Learning這項任務。

一個可能的機器學習算法是袋裝的k近鄰言語,

創建training set [你知道自己的興趣是什麼用戶],並使用Bag Of Words [最好用n-grams]「學習」訓練集。

當新用戶到達時 - 將單詞/ n-grams提取爲要素 - 並找到要確定興趣所在的內容。

爲了隨着時間的推移獲得改進 - 您可以獲得一些額外的明確反饋 - 用戶可以點擊一致/不同意算法的說法。您稍後可以使用這些信息來擴展訓練集的大小 - 這可能會導致更準確的決策。

這是一個用於學習句子/單詞組之間「特徵」的標準算法,因此您至少應該將其用作指導。

還有一個開源項目,可能會對您有所幫助:Apache Mahout

+0

+1你可以建議我一些圖書館的蟒蛇我知道nltk – vireshas 2012-03-01 14:51:10