-1

我目前正在實施分佈式在線機器學習框架。基本上這個系統處理樣品的數據流。模型(例如感知器層)將隨每個樣本更新。用於大規模更新並在單個實體上閱讀的數據庫

所以,我正在尋找一個數據庫,可以支持大規模更新和閱讀一個單一的實體。我認爲mongodb和它是「更新就地」是一個不錯的選擇,但也許有一個更適合我需求的數據庫。

+0

mongodb可能工作得很好。只有一種方法可以知道。 :) – 2013-03-18 10:01:04

+0

爲什麼不更新內存中,只是存儲在純文件備份? – driushkin 2013-03-18 11:20:59

+0

該模型需要從一個集羣中的不同機器(它是一個分佈式系統)進行升級/更新。內存更新將導致羣集中每個實例的不同模型。 – 2013-03-18 12:03:42

回答

0

我來試試看......

我會給我已經成爲蒙戈的一個相當大風扇的免責條款,所以考慮到這一點。 =)

Mongo將是讀取的好選擇,但只有如果您願意讓數據稍微不一致。 Mongo有一個叫做副本集的東西,它基本上是一個集羣。

副本集只有一個可以接收寫入/更新的機器。它處理得很好,但這是需要考慮的事情。這不是一個主/主複製設置。

隨着寫入/更新進入,它們被複制到副本集中的其他節點。這是最終一致性的地方。

您可以考慮類似Couchbase/CouchDB,它也有一個集羣概念,它是主/主。您可以寫入任何節點,並最終在其他節點上可用。

有些事情要考慮。

編輯:

我會去與蒙戈。 =)

相關問題