我是hadoop的新手,我寫了幾個作業並將它們導出爲jar文件。我可以使用hadoop jar命令運行它們,我希望每隔一小時運行一次這些作業。我該怎麼做呢?提前致謝。如何在hadoop中安排作業
2
A
回答
3
Hadoop本身沒有辦法按照您的建議安排工作。所以你有兩個主要的選擇,Java的時間和調度功能,或者從操作系統運行作業,我會建議Cron。我個人使用cron來做到這一點,它非常簡單且非常靈活,並且在大多數服務器上默認安裝。還有很多教程。
Cron示例在每小時的第一分鐘運行。
0 * * * * /bin/hadoop jar myJar.jar
如果你想保持它的Java內部本身,我建議檢查出這個問題,其中有細節和代碼,How to schedule task for start of every hour。
3
你可以通過編寫一個cron或者一些腳本來實現。但在我看來,更好的方法是使用一些調度程序,如Oozie。
0
0
添加另一種選擇的cron & Oozie的,Quartz Scheduler
相關問題
- 1. 如何殺死hadoop作業
- 2. 如何在並行hadoop作業中運行stando hadoop distritbuion 0.20.0
- 3. 安排Spark Streaming作業
- 4. hadoop作業中的org.apache.hadoop.fs.BlockMissingException
- 5. 如何讀取Hadoop Sequentil文件作爲Hadoop作業的輸入?
- 6. zookeeper如何確定hadoop作業的'java.library.path'?
- 7. Hadoop作業如何自己殺死
- 8. 在窗口上安排作業
- 9. Hadoop作業在FBUtilities.java中拋出NullPointerException
- 10. 在hadoop中運行作業 - 錯誤security.UserGroupInformation
- 11. 在Hadoop中鏈接多個MapReduce作業
- 12. hadoop流式作業在python中失敗
- 13. Hadoop Streaming作業在python中失敗
- 14. 如何排隊作業
- 15. 如何安排SSIS包從SQL Server代理作業中運行?
- 16. 如何在Java中爲Hadoop作業定義ParquetOutputFormat的parquet模式?
- 17. Rails 4.2/Sidekiq - 重構作業代碼如何影響已安排的作業
- 18. Hadoop DistributedCache無法在hadoop作業中報告狀態
- 19. 本地hadoop作業的dfs.block.size?
- 20. 未殺死Hadoop作業
- 21. Hadoop作業剛剛結束
- 22. Oozie的蜂巢Hadoop作業
- 23. hadoop作業輸出文件
- 24. Hadoop作業調度查詢
- 25. 如何在pl/sql中安排工作?
- 26. 立即安排Cron/Quartz作業
- 27. Sidekiq - 重新安排失敗的作業
- 28. 使用PHP來安排cron作業
- 29. Apache Aurora cron作業未安排
- 30. Laravel取得日程安排作業
這可能並不是一個好的建議,因爲Falcon和Jenkins的目的都與OP想要的不同。另外,詹金斯可能無法在客戶網站上使用。我會推薦塔裏克的&greedybuddha的答案。 – KNP 2017-09-13 21:32:17