1

我特別感興趣的是,如何能夠處理大量的信息以用於Google搜索或Google地圖等商業服務。我們都知道他們使用(或至少)「做」了一種Linux集羣,但他們究竟是如何組織的?他們使用什麼樣的硬件,哪些文件系統,網絡,哪些問題最頻繁?Google搜索/地圖Linux羣集的軟件/硬件結構?

+1

http://research.google.com/pubs/papers.html是開始的地方。 – 2010-06-09 22:39:14

回答

1

答案取決於你正在嘗試做什麼。谷歌創建了自己的發佈數據庫,但他們也創建了自己的計算機農場和其他許多東西。一旦你決定採用同樣的方式,就不會有什麼簡單的事情要做,但是肯定你需要投入數百萬美元來投資基礎設施和開發。 Matthew在評論中提供了關於Google所做工作的數學鏈接。

但是,如果您的目標是創建Web應用程序,那麼您可能不想花時間自行創建infrasturucture,而是使用市場上已有的產品。如果您希望創建可以處理大量數據的應用程序,並且每小時都能爲數百萬客戶提供服務,那麼您應該定義一下雲計算基礎設施,如Amazon Elastic Computing Cloud和Microsoft Azure。

優勢在於,您可以以合理的價格獲得巨大的計算場,並實現了數據庫應用程序和即時可擴展性,並且不會產生與其相關的IT成本。當需求峯值通過時,您可以立即將其從一臺服務器擴展到一百臺,然後再回到一臺。

這裏的亞馬遜彈性計算雲的描述: http://aws.amazon.com/ec2/

這裏是他們的可擴展的數據庫服務描述: http://aws.amazon.com/simpledb/ http://aws.amazon.com/rds/