0

我正在處理一個推薦問題,其中涉及300萬用戶和500,000個產品。該建議的目的是在訪問特定產品時向特定用戶推薦5-10個更多產品。大型推薦器

我們完成了實時推薦引擎部分,但我們發現在1-2秒內推薦並不那麼容易。我們認爲兩種策略:

  1. 運行建議脫機批處理模式,然後把結果存儲在MySQL的DB。但是,表格中的條目數量似乎是一個巨大的數字。每個產品的每個用戶應至少存儲5-10個推薦產品。如果我創建一個包含用戶和產品的表格作爲表格屬性,則會有300萬x 500,000條目。

  2. 預測飛行中的建議。我們只是試了一下,但響應時間太長了。

任何人都可以給我一些關於這個問題的建議嗎?

+0

爲什麼你爲每個用戶生成每個項目? (只是好奇) – 2013-06-07 13:47:08

+0

這取決於推薦引擎的工作原理 - 如果推薦引擎只關注客戶最近的購買(應該相對較少),並且在近期購買和推薦產品之間存在某種(有效)指數,那麼實時建議應該是相當可行的。你能否多給我們介紹一下推薦引擎的工作原理? – Justin 2014-01-09 14:41:18

回答

0

對於我來說,創建每個用戶產品對的推薦產品列表看起來很奇怪。通常情況下,您只有每種產品的類似產品列表才能滿足您的使用情況。