2011-06-17 71 views

回答

26

研究Hadoop或MapReduce可能是一項艱鉅的任務,如果您在開始時弄髒手。
我跟着時間表如下:

  1. 開始與MR的非常基本與 code.google.com/edu/parallel/dsd-tutorial.html code.google.com/edu/parallel/mapreduce- tutorial.html
  2. 然後前往 www.cs.washington.edu/education/courses/cse490h/08au/lectures.htm 前兩場講座介紹MapReduce和Hadoop的一個很好的課程。
  3. 閱讀開創性的論文 http://research.google.com/archive/mapreduce.html及其更新版本 http://www.cs.washington.edu/education/courses/cse490h/08au/readings/communications200801-dl.pdf
  4. 改進,然後去在上面給出的U.Washington鏈接的其他所有視頻。
  5. 嘗試youtubing條款的Map Reduce和Hadoop來查找ORielly和谷歌圓桌視頻Hadoop的和MapReduce
  6. 未來的很好的概述,然後關閉的最重要的視頻 -
    Cloudera的影片
    www.cloudera。 COM /資源/?媒體=視頻

    谷歌MiniLecture系列
    code.google.com/edu/submissions/mapreduce-minilecture/listing.html

除了機智^ h所有的多媒體上面,我們需要良好的書面材料
文件:在hadooper.blogspot.com

  1. 架構圖是件好事,對您的牆壁
  2. 的Hadoop權威指南去多進螺母和螺栓整個系統中,作爲 Hadoop在行動是一個很好的閱讀與大量的教學示例來學習hadoop的概念。 臨Hadoop是不適合初學者Apache的文檔
  3. PDF文檔基金會
    hadoop.apache.org/common/docs/current/
    和 hadoop.apache.org/common/docs/stable/
    將幫助您將瞭解如何將您的問題建模到MR解決方案中,以便總體上獲得Hadoop的優勢。
  4. HDFS paper by Yahoo!研究也是一個很好的閱讀,以深入瞭解hadoop
  5. 訂閱Commons,MapReduce和HDFS的用戶郵件列表,以便了解問題,解決方案和未來的解決方案。
  6. 嘗試專家路徑http://developer.yahoo.com/hadoop/tutorial/module1.html鏈接初學者Hadoop的

任何疑問...
聯繫了Apache,谷歌,必應,雅虎

3

你的問題看起來過於寬泛 - 爲了在查看源代碼時獲得資源,你應該縮小你想要學習的內容。這將使您(以及SO上的任何人)更容易找到涵蓋該主題的論文/主題。

我已經挖了幾次Hadoop源碼。通常我需要了解一個非常具體的課程。在這些情況下,並不是真的需要外部資源,並且因爲我有類名,所以我只是爲此尋找資源。

如果我要開始嘗試理解更高級別的hadoop源代碼,我會得到源代碼和Hadoop: The Definitive Guide的副本,並將其作爲參考以瞭解源代碼的更高級別連接。

我不會聲稱這將是一個完美的解決方案。 H:TDG比我的其他hadoop書更具技術性,我發現它的內容非常豐富。 H:TDG是我開始的,當我發現我想深入挖掘的領域時,我會開始尋找那些具體的東西。