2012-04-20 61 views
2

我想弄清楚一種方式,我可以代表一個Facebook用戶作爲一個載體。我決定將用戶的不同屬性/參數堆疊成一個大的矢量(即年齡是一個大小爲100的矢量,其中100是您可以擁有的最大年齡,如果您可以說50,則前50個值該矢量就像溫度計一樣)。我無法想出一種方法來將臉譜利益作爲一種媒介來表達,他們是一組詞彙,代表所有詞彙的空間是巨大的,我無法像一袋文字那樣尋找模型或相似的東西。有誰知道我應該怎麼做?我仍然對此感到陌生,任何參考都將不勝感激。機器學習如何使用Facebook用戶的興趣來作出決定

在希望投票回答這個問題的情況下,讓我知道它有什麼問題,以便我可以改進措辭和上下文。

謝謝

回答

2

「正確」的方法取決於你的學習算法是什麼以及決策問題是什麼。

儘管如此,將年齡表示爲單個數字特徵而不是100個指標特徵通常會更好。這樣,學習算法不需要學習這百種功能之間的關係(它已經被烘焙),而且問題的尺寸減少了99個,這會使一切變得更好。

爲了模擬的利益,你可能要開始用語言模型的極高立體袋,然後用各種選項之一來減少維度: