apache-pig

1熱度

1回答

我的命令是爲下： Z = LOAD '/..file_path' USING PigStorage(',') AS (name:CHARARRAY,gpa:int,salary:int); y = GROUP Z BY gpa; R = FOREACH y GENERATE SUM(Z.salary); 我得到的 DUMP R; 輸出爲： {all,()}; 請指導我。 TIA。

0熱度

1回答

豬 - 如何使用shell命令模式文件/文件夾名稱

豬腳本中是否有使用這種語法的方法？命令： /* some pig latin code here */ mv /user/test/folder_pattern* /path/to/move /* some pig latin code here */ 錯誤： [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 2997: En

-1熱度

1回答

在配置單元中對非結構化數據執行單詞計數時出錯

我正在運行此配置單元查詢以獲得非結構化數據上的單詞明智數。 select a, count(*) from (select(EXPLODE(SPLIT(regexp_replace(upper(word,'[[email protected]#$%&*]',''))) AND EXPLODE(SPLIT(regexp_replace(UPPER(word,'[^A-Za-z0-9 ]','')))

2熱度

1回答

由crontab調度的豬腳本沒有給出結果

我有豬腳本，當我從豬（地圖減少模式）運行時給出正確的結果，但是當我從crontab計劃不按照腳本存儲輸出。豬腳本， a1 = load '/user/training/abhijit_hdfs/id' using PigStorage('\t') as (id:int,name:chararray,desig:chararray); a2 = load '/user/training/abhi

1熱度

3回答

豬腳本不適用於MapReduce

我正在嘗試使用Hadoop和Apache Pig。我有一些數據和腳本中的.txt文件.pig與我的腳本文件： student = LOAD '/home/srv-hadoop/data.txt' USING PigStorage(',') as (id:int, firstname:chararray, lastname:chararray, phone:chararray, city:

-1熱度

1回答

我們可以在Apache pig中訪問腳本B中腳本A加載的關係嗎？

我的問題是，如果有一種方法可以從script2.pig訪問sript1.pig中的關係「data1」版本，而無需再次加載數據？ script1.pig具有： data1 = LOAD '$some_location'USING PigStorage('\t') AS (...); RUN script2.pig; EXEC; script2.pig有： filter1 = FILTER dat

0熱度

1回答

收到錯誤1070，而在豬

袋子上用枚舉我嘗試使用下面的代碼來枚舉袋： DEFINE Enumerate datafu.pig.bags.Enumerate('1'); group = GROUP data1 By (query_text); ranked = FOREACH group { ordered = ORDER data1 BY score DESC;

-1熱度

1回答

與豬

卸妝數據考慮CSV數據的以下兩行： 01-15-2014 12:04:05, row1 2014/02/20, row2 第1行具有所需的時間戳格式MM-DD-YYYY HH：MM：SS。第2行時間戳需要轉換爲匹配。那麼我怎樣才能完成這項任務。

0熱度

1回答

去除豬

空行我有一個數據集，像一擊： 1,abc,10000 ,zxcv,2000 , , , 4,xyz,50000 我想輸出，如： 1,abc,10000 zxcv,2000 4,xyz,50000 我怎樣才能實現這個任務？即我想刪除空行和null值。

-1熱度

1回答

豬：用於編寫記錄類型在一個文件到多個輸出

我有一個單一的文件中的以下數據 "HD",003498,"20160913:17:04:10","D3ZYE",1 "EH","XXX-1985977-1",1,"01","20151215","20151215","20151229","20151215","2304",,,"36-126481000",1340.74,61808.00,1126.62,0.00,214.12,0.00,0.0