2014-11-03 65 views
0

問題:我目前使用python-recsys和SVD算法來計算我的用戶建議推薦引擎的簡單,但數據沉重的Web應用程序

。計算是相當快的(現在),但我想知道如果我們活着會如何表現。我們有大約100萬個產品存儲在Mongodb中,預計大約有100個用戶可以開始使用。我已經模擬了類似的情況,但這種隨機生成的數據實際上並不適用於真實情況。

我們使用Redis的建議進行儲存,他們在計算任務芹菜每2小時,目前是真正的內存沉重,儘管我做了我所能對其進行優化。

擔心將來我打算使用的Neo4j該任務雖然這是很難找到使用這個分貝建議開發商任何現實生活中的故事。

一般來說我想達成的目標是合理的工作推薦引擎(象夫會矯枉過正,在這種情況下,我猜),這是不是真的內存,因爲我們無法承受許多服務器。

如何將Neo4j的那個問題打?那個數據庫有沒有好的Python驅動程序?也許最好是使用當前的Mongodb/Redis解決方案並調整它一點,而不是將另一個數據庫添加到當前堆棧?我也在考慮使用單獨的機器進行純粹的推薦計算 - 但這是一個不錯的選擇嗎?

回答

1

擔心將來我打算使用的Neo4j該任務雖然 這是很難找到的使用 這個分貝建議開發商任何現實生活中的故事。

http://seenickcode.com/switching-from-mongodb-to-neo4j/

如何將Neo4j的那個問題打?那個db有沒有好的python 驅動?

http://neo4j.com/developer/python/

+0

下面是一個推薦引擎的一個示例:http://neo4j.com/developer/guide-build-a-recommendation-engine/有更多的例如在http://maxdemarzi.com – 2014-11-04 09:08:16