2012-11-18 67 views
0

我正在設計&實現(近)實時Web分析引擎。這與Google AnalyticsChartBeat類似。預計每天將有近1.5億個請求。我們有5到8臺帶有2.5GHz(8核)CPU和16GB RAM的機器。實時或近實時分析應用程序設計考慮因素

我正在尋求針對此需求的橫向可伸縮解決方案。目前,我正在爲此分析mongo-hadoop組合。從我迄今爲止所瞭解的情況來看,難以將所有數據保存在一個地方(一臺機器)進行分析。所以,作爲數據處理器的Hadoop和作爲數據存儲的MongoDB對我來說是一個很好的組合。

是否有標準或(我應該說)這種應用程序的經過驗證的架構?我應該採取什麼樣的設計考慮? mongo-hadoop組合是否爲某人工作?

+0

Hadoop和實時?不,沒有聽說過。 –

回答

2

我假設你已經閱讀過這個?

http://www.mongodb.org/display/DOCS/Hadoop+Quick+Start

更多細節和工作示例這裏碎片化配置 - http://www.slideshare.net/spf13/mongodb-and-hadoop

+0

是的,我已閱讀文檔。但是這並沒有提到該適配器是否適用於分片配置。我正在尋找更多的細節,而不是一個簡短的例子。 – dvl

+0

是的,它可以使用分片配置。這裏有很好的演示示例 - http://www.slideshare.net/spf13/mongodb-and-hadoop –

相關問題