0
我必須實現一個map-reduce作業循環。每次迭代將根據前一次迭代終止或繼續。要做出的選擇是基於「在減速器輸出中出現一個詞」。Reducer可以在Hadoop mapreduce中傳遞給驅動程序的消息嗎?
當然,我可以用我的驅動程序檢查整個輸出txt文件。但它只是一個單詞,並且通過整個文件將會矯枉過正。我正在考慮是否有任何方法來建立減速器和驅動程序之間的通信,一旦它檢測到這個詞,減速器可以通知驅動程序?由於要傳輸的消息很少。
Mapreduce支持「計數器」的概念。或者,您可能想嘗試使用Spark,以便將您正在構建到工作流而非循環中的「DAG任務」 –