2011-04-05 66 views
1

我在談論像電影/物品推薦,但似乎房地產更棘手。在訪問網站並搜索RE時,應該向用戶提出一些建議。我們將這項任務分成兩個任務:如何實現房地產推薦引擎?

a)用戶還沒有輸入任何個人信息 - 基於物品的推薦 b)用戶已經輸入了他/她的詳細信息,如收入,位置等 - 項目/基於用戶的推薦

我認爲任務a)的第一件事是開始建模RE功能,但使用一些範圍而不是精確值。例如:

  1. 在2區

    • 40 - 50,我們可以將其標記爲 「1」
    • 50 - 70是 「2」
    • 等...
  2. 價格:

    • 20 - 30對數千名€將被標記爲1
    • 30 - 40將是2
    • 等...
  3. 接近市中心:

    • 1爲RE在市中心
    • 2爲區域2或距離中心最多2/3公里
    • 3爲區域3或距離中心7公里

所以具有範圍讓我們指定一個矢量到每個RE屬性這將允許我們使用:歐幾里德距離,Pearson相關和一些最近鄰算法。

請評論我的方法或建議一個新的。

+0

爲什麼你在課堂上使用任意的基數標籤?在我看來,你可以使用trunc(area/20)和trunc(income/10000)來獲得更一般的,更自然的映射。強迫從中心到數學公式的距離似乎不那麼直觀,但我認爲它可以完成。 – tripleee 2011-08-07 10:21:15

回答

2

如果您已擁有足夠流量的網站,則可以嘗試純粹的協作過濾方法,即查看此屬性的人也查看了這些其他屬性。您可以使用Pearson相關性來獲得良好的結果。 RE

相似度之間2可以當用戶正在觀看屬性RE可以被示出基於所述相似性得分與性質的所有其它RE屬性進行排序,並示出了前幾名被定義爲

 
     number of people who viewed both RE1 and RE2 
sim = --------------------------------------------- 
     number of people who viewed either 1 or both 

你可以在這個頂部添加一些明顯的過濾器,如屬性的位置,價格範圍等。

您也可以定義相似,你建議,並從兩個從那些沒有如果使用純協同過濾算法中獲得的機會很高新的稀土項目良好的代表性結果混合。