2011-05-30 57 views
0

如何將Hadoop還原器的輸出路徑保存爲變量?將reducer輸出目錄路徑保存到Hadoop中的變量中

該變量將被所有其他MR作業使用。

這些工作將是連續的。

所有順序MR作業都會將其相應的輸出寫入該輸出目錄。

我需要他們的路徑變量進行相應的更新。

+0

也許我誤解你,但你希望所有MR作業輸出到同一個目錄?你不能那樣做;作業的輸出目錄必須爲空。 – ajduff574 2011-05-31 14:59:33

+0

或者你想連鎖一起工作,其中一個的輸出是下一個的輸入? – ajduff574 2011-05-31 15:00:30

+0

您是從shell還是從java程序提交? – 2011-05-31 18:29:40

回答

0

看看「Oozie」。這是一個Hadoop工作流程引擎,它允許您描述的內容。多個作業可以將其「輸入」作爲上一份作業的「輸出」。

還有其他解決方案,如「級聯」API。

http://www.concurrentinc.com/products/ http://yahoo.github.com/oozie/releases/2.0.0/#Quick_Start

+0

謝謝Jeremy但問題是我不能使用「級聯」,但我會嘗試使用Oozie。目前,我正在使用簡單的Hadoop代碼來解決問題,如果它不起作用我將使用Oozie。 – Kal 2011-06-01 08:22:12