6
當我設置fileinputFormat作爲hadoop輸入。 arg[0]+"/*/*/*"
表示不匹配任何文件。可以hadoop從多個目錄和文件採取輸入
什麼,我想是從多個文件爲已讀:
Directory1 ---Directory11 ---Directory111 --f1.txt --f2.txt ---Directory12 Directory2 ---Directory21
是否有可能在Hadoop中? 謝謝!
所以它會從一個文件夾中的多個文件夾讀取並遞歸地讀取每個子文件夾中的許多文件? – JudyJiang 2013-05-08 16:52:46
我錯了,並更新了我的答案以反映這一點。我猜你的「arg [0]」是錯誤的。你從哪裏使用?如果它的命令行可能需要$ arg [0],如果它來自代碼,則應該使用multipleinputs方法 – greedybuddha 2013-05-08 17:07:32
它在我的java代碼中。我使用FileInputFormat.setInputPaths(conf,new Path(args [0]);它是args [0],並且它之後我應該替換多個目錄部分? – JudyJiang 2013-05-08 18:22:53