2016-02-26 372 views
1
  1. 我已經創建了輸入文本文件test.txt並把它作爲HDFS /user/yogesh/Input/test.txt
  2. 創建的輸出路徑上HDFS爲/用戶/約傑什/輸出
  3. 創建於本地/home/yogesh/WordCount.jar jar文件,並提交當地MR的工作,這樣的:hadoop jar /home/yogesh/WordCount.jar WordCount /user/yogesh/Input/test.txt /user/yogesh/Output/output1

我有以下錯誤:線程「main」中的異常org.apache.hadoop.mapreduce.lib.input.InvalidInputException:輸入路徑不存在:hdfs:host/user/yogesh/WordCount

Exception in thread "main"
org.apache.hadoop.mapreduce.lib.input.InvalidInputException:Input path does not exist: hdfs:host/user/yogesh/WordCount.

hdfs:host/user/yogesh/- 是我的HDFS目錄。我無法理解爲什麼這個MR作業在HDFS中尋找代碼以及如何解決這個錯誤。

回答

0

先給名包類字計數作爲其前綴,或者只是跳過級,並只使用廣口瓶,輸入,輸出,這樣的:

hadoop jar /home/yogesh/WordCount.jar /user/yogesh/Input /user/yogesh/Output/output1 

同時,確保/user/yogesh/Output/output1不存在在執行此命令之前。此外,請注意您應該提供輸入目錄而不是輸入文件。 Hadoop將把指定目錄中的所有文件作爲輸入。

有關示例,請參閱this site中WordCount示例的運行方式。

相關問題