2016-12-30 75 views
1

我對Hadoop非常陌生,並試圖使用this運行一個簡單的程序。Hadoop 2.7.3 Streaming Jar無效

我抄本地實例數據HDFS,但在我的地圖縮小,當我運行此命令按照Apache官方文檔

hadoop jar hadoop-streaming-2.7.3.jar \ 
-input /user/hduser/gutenberg/* \ 
-output /user/hduser/gutenberg-output \ 
-mapper /home/hduser/mapper.py \ 
-reducer /home/hduser/reducer.py 

我收到此錯誤

工作不是有效的JAR:/usr/lib/hadoop-streaming-2.7.3.jar

請儘量幫助我。

回答

2

它正在使用Hadoop 2.7.3

以下是你需要運行

[Linux的] $ Hadoop的罐子在/ usr /本地/ Hadoop的/股/ Hadoop的/ tools/lib目錄/ Hadoop的命令-streaming-2.7.3.jar -file /home/python/mapper.py /home/python/reducer.py -mapper「python mapper.py」-reducer「python reducer1.py」-input/tmp/word_i -output/tmp/word_output

相關問題