我正在設計&實現(近)實時Web分析引擎。這與Google Analytics和ChartBeat類似。預計每天將有近1.5億個請求。我們有5到8臺帶有2.5GHz(8核)CPU和16GB RAM的機器。實時或近實時分析應用程序設計考慮因素
我正在尋求針對此需求的橫向可伸縮解決方案。目前,我正在爲此分析mongo-hadoop組合。從我迄今爲止所瞭解的情況來看,難以將所有數據保存在一個地方(一臺機器)進行分析。所以,作爲數據處理器的Hadoop和作爲數據存儲的MongoDB對我來說是一個很好的組合。
是否有標準或(我應該說)這種應用程序的經過驗證的架構?我應該採取什麼樣的設計考慮? mongo-hadoop組合是否爲某人工作?
Hadoop和實時?不,沒有聽說過。 –