嗨,我是Hadoop和NoSQL技術的新手。我開始通過讀取存儲在HDFS中的文件並進行處理來學習世界計數程序。現在我想在MongoDB中使用Hadoop。從here開始計劃。Hadoop與MongoDB概念
現在我對它存在困惑,它將mongodb數據存儲在本地文件系統中,並將本地文件系統中的數據從map/reduce讀取到HDFS,然後再將其寫入到mongodb本地文件系統。當我學習HBase時,我們可以將其配置爲將其數據存儲在HDFS上,並且hadoop可以在HDFS(map/reduce)上直接處理它。如何配置mongodb以將其數據存儲在HDFS上。
我認爲最好的方法是將數據存儲在HDFS中進行快速處理。不在本地文件系統中。我對嗎?如果我走錯了方向,請清除我的概念。
雖然這可能與驅動器工作https://ccp.cloudera.com/display/ CDHDOC/Mountable + HDFS,我不明白你爲什麼要在MongoDB上引入這樣的圖層?它仍然只能在一臺機器上使用。所以,除了減慢mongo並可能破壞整個過程的穩定性之外,我不明白你爲什麼要這樣做? 10gen已經創建了一個分佈式解決方案。 – WiredPrairie 2013-02-14 11:58:56