我試圖運行說明命令在豬的別名在本地和hdfs模式也。 但我得到錯誤。如何運行說明豬的命令?
2014年8月27日19:18:06703 [主要] ERROR org.apache.pig.pen.ExampleGenerator - 錯誤讀取的數據。內部 錯誤創建作業配置。 java.lang.RuntimeException:內部 錯誤創建作業配置。 (org.apache.pig.PigServer.getExamples(PigServer.java:1182) org.apache.pig.tools.grunt)。 GruntParser.processIllustrate(GruntParser.java:739) at org.apache.pig.tools.pigscript.parser.PigScriptParser.Illustrate(PigScriptParser.java:626) at org.apache.pig.tools.pigscript.parser.PigScriptParser。解析(PigScriptParser.java:323) at org.apache.pig.tools.grunt.GruntParser.parseStopOnError(GruntParser.java:194) at org.apache.pig.tools.grunt.GruntParser.parseStopOnError(GruntParser.java: 170) at org.apache.pig.tools.grunt.Grunt.run(Grunt.java:69) at org.apache.pig.Main.run(Main.java:538) 在org.apache.pig.Main.main(Main.java:157) 在sun.reflect.NativeMethodAccessorImpl.invoke0(本機方法) 在sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) 在陽光下。反射。在org.apache.hadoop.util.RunJar.main(RunJar.java:208)上的java.lang.reflect.Method.invoke(Method.java:606) DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 2014-08-27 19:18:06,707 [main] ERROR org.apache.pig.tools.grunt.Grunt - 錯誤2997:遇到IOException。日誌文件中的異常詳細信息:/opt/pig_1409147241095.log
我正在使用此示例運行Illustrate命令。
假設輸入文件是 'visits.txt' 包含以下數據:
艾米cnn.com 20070218佛瑞德harvard.edu 20071204艾米
bbc.com 20071205佛瑞德stanford.edu 20071206
咕嚕會話可能是這個樣子(注意使用時加載的數據模式ExampleGenerator需要你提供的別名):
grunt> visits = load 'visits.txt' as (user, url, timestamp);
grunt> recent_visits = filter visits by timestamp >= '20071201';
grunt> user_visits = group recent_visits by user;
grunt> num_user_visits = foreach user_visits generate group, COUNT(recent_visits);
grunt> illustrate num_user_visits
沒有那個技巧是行不通的。我改變了我的代碼,如下所示: 'visits = load'visits.txt'as(user,url); user_visits =用戶組訪問; 說明user_visits' 我已經執行了非常簡單的代碼,這裏沒有任何時間或日期變量。 – 2014-08-28 13:58:32
您可以粘貼'/opt/pig_1409147241095.log'的內容。你也能夠在grunt shell中轉儲'訪問'嗎? – pradeep 2015-09-24 15:09:01