2012-01-14 123 views

回答

3

B)我不想存儲中間文件

三)我不想安裝包,比如層疊,Yelp的,Oozie的。

任何原因爲什麼?根據迴應,可以提供更好的解決方案。

中間文件無法避免,因爲之前的Hadoop作業的o/p無法作爲i/p流式傳輸到下一個作業。創建這樣

運行流JOB1
腳本,如果JOB1是不是成功,然後退出
運行流作業2
如果作業2是成功刪除它們JOB1其他出口O/P
運行流作業3
如果作業3是他們成功的情況下刪除作業2否則退出的O/p

+0

- 因爲我剛開始學習的Hadoop(一個項目),這我應該如何去 - 對於「JOB1」 ,「job2」等我是否需要定義一些工作? - 正如你所說,我會嘗試你的方法。但是在這種情況下,只要編寫一個腳本就行了?我不是想用一些命令行,如「hadoop * streaming * .jar -input -put -mapper -reducer 」 – 2012-01-14 08:48:18

+0

我明白了,它很好用,謝謝。 – 2012-01-16 04:24:01

相關問題