要創建MapReduce作業,您可以使用舊的org.apache.hadoop.mapred
程序包或較新的org.apache.hadoop.mapreduce
程序包對Mappers and Reducers,Jobs ...第一個標記爲已棄用,但此時已恢復。現在我想知道使用舊的mapred軟件包還是新的mapreduce軟件包來創建工作以及爲什麼更好。還是僅僅取決於你是否需要諸如舊的mapred軟件包中可用的MultipleTextOutputFormat之類的東西?使用mapred或mapreduce包創建Hadoop作業會更好嗎?
43
A
回答
39
14
舊的和新的API都很好。新的API雖然更清潔。儘可能使用新的API,並且在需要特定類別的地方使用舊的API(例如MultipleTextOutputFormat
)
但是務必不要在新舊API中混合使用相同的Mapreduce作業。這會導致奇怪的問題。
2
舊的API(mapred)
存在問題的包org.apache.hadoop.mapred
提供地圖/減少作業配置。
- 減少值對於給定的密鑰,基於所述迭代器
- 包Summary
新的API(MapReduce的)
存在問題的包裝org.apache.hadoop.mapreduce
作業配置由獨立的類完成,稱爲JobConf,它是外延的配置
類的nsion減少值給定鍵的基礎上,可迭代
相關問題
- 1. 包含HTML標記的Hadoop MapReduce作業
- 2. 使用FragmentTabHost或SlidingTabLayout創建導航選項卡會更好嗎?
- 3. 在Hadoop中鏈接多個MapReduce作業
- 4. Hadoop MapReduce作業權限被拒絕
- 5. 使用圖像創建mapreduce作業作爲輸入
- 6. Hadoop管道和新的mapred軟件包
- 7. 使用fwrite()或move_uploaded_file()會更好嗎?
- 8. 從servlet調用mapred作業時出錯
- 9. jQuery或Prototype會更好嗎?
- 10. Hadoop eclipse mapreduce不起作用?
- 11. Hadoop的mapred:附加源HOWTO
- 12. 排序順序與Hadoop MapRed
- 13. 使用Fragments會更好嗎?
- 14. 用hadoop上的java運行初級mapreduce作業
- 15. 用於運行MapReduce作業的Hadoop命令
- 16. 在AWS上使用Hadoop或Hadoop Streaming for MapReduce
- 17. 關於gz文件作爲hadoop mapreduce作業輸入的輸入
- 18. 你如何使用MapReduce/Hadoop?
- 19. hadoop mapreduce
- 20. hadoop mapred job - 初始化嘗試mapred任務時出錯
- 21. HbaseTestingUtility和MapReduce作業
- 22. 剖析MapReduce作業
- 23. Amazon Elastic MapReduce:無法創建包含大量實例的作業流程
- 24. 如何編譯Hadoop 2.7.0上的MapReduce作業源代碼?
- 25. 我們可以在Hadoop Streaming(lang:Python)中級聯多個MapReduce作業
- 26. 通過Python無PuTTy/SSH啓動Hadoop MapReduce作業
- 27. 如何從Eclipse中調試hadoop mapreduce作業?
- 28. Apache Ignite Hadoop加速器MapReduce作業不在JobHistory服務器中
- 29. 我如何查看mapreduce作業/ hadoop輸出文件
- 30. 共享conf變量或使用兩個作業?哪個更好?
'但是這得到了恢復meanwhile'你確定嗎? –
例如r0.21.0中org.apache.hadoop.mapred.lib包中的接口映射器在r0.20.2中被標記爲已棄用時未被標記爲已棄用。 – momo13