我一直在試圖理解MongoDB中的MapReduce的基礎知識,甚至在實現它之後,我不確定它與SQL的GROUP BY甚至Mongo自己的GROUP BY有什麼不同。在SQL服務器中,GROUP BY可以通過流或散列聚合來完成。 MapReduce與散列彙總不同,只是在大量的服務器上?
MapReduce和SQL GROUP BY
我一直在閱讀MR for MongoDB作爲後臺進程的地方,因爲它是一個「繁重的操作」。鑑於數據被分割,GROUP BY不會同樣「重」嗎?也就是說,我只是試圖比較可能作爲MR作業或使用GROUP BY查詢實現的那些類型的操作。
GROUP BY不能做什麼,只有MR能做什麼?
此外,Hadoop似乎是非常擅長於MR(這只是我已閱讀..我從來沒有在Hadoop工作過)。 Hadoop的MR與Mongo的MR有什麼不同?
我很困惑。請幫助或指導我解釋MapReduce需求的好教程。
感謝您的洞察力。然後,我認爲MapReduce基本上是一種聚合的「哲學」,如果我們可以即時生成新表並將中間MR結果存儲到SQL服務器中,他們? – 2012-07-06 09:38:52
不要忘記標記爲答案,如果它確實回答你的問題或至少投票! :) – Ms01 2012-07-06 09:55:33
不錯的圖表:) Upvoted .... – 2012-07-06 10:18:47