2
我正在R中編寫Hadoop流式處理作業,而且我遇到了一個相當奇怪的情況,我找不到任何文檔。我想運行一個減少工作(不需要映射器),直接傳遞給另一個映射器。沒有初始映射器,是否可以在縮減作業之後直接堆疊地圖作業?如果我編寫一個身份映射器來將輸出傳遞給我的reduce工作,那麼我可以將reduce輸出傳遞給另一個映射器,如果是這樣,怎麼辦?我目前的代碼是:Hadoop流式縮減器映射器
$HADOOP_HOME/bin/hadoop jar /opt/cloudera/parcels/CDH-5.3.2-1.cdh5.3.2.p0.10/lib/hadoop-0.20-mapreduce/contrib/streaming/hadoop-streaming.jar \
-reduce myreducer.r \
-input myinput/ \
-output myoutputdir \
-file file1.r \
-file file2.Rdata
而這不起作用。