apache-pig

    1熱度

    1回答

    我的命令是爲下: Z = LOAD '/..file_path' USING PigStorage(',') AS (name:CHARARRAY,gpa:int,salary:int); y = GROUP Z BY gpa; R = FOREACH y GENERATE SUM(Z.salary); 我得到的 DUMP R; 輸出爲: {all,()}; 請指導我。 TIA。

    0熱度

    1回答

    豬腳本中是否有使用這種語法的方法? 命令: /* some pig latin code here */ mv /user/test/folder_pattern* /path/to/move /* some pig latin code here */ 錯誤: [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 2997: En

    -1熱度

    1回答

    我正在運行此配置單元查詢以獲得非結構化數據上的單詞明智數。 select a, count(*) from (select(EXPLODE(SPLIT(regexp_replace(upper(word,'[[email protected]#$%&*]',''))) AND EXPLODE(SPLIT(regexp_replace(UPPER(word,'[^A-Za-z0-9 ]','')))

    2熱度

    1回答

    我有豬腳本,當我從豬(地圖減少模式)運行時給出正確的結果,但是當我從crontab計劃不按照腳本存儲輸出。 豬腳本, a1 = load '/user/training/abhijit_hdfs/id' using PigStorage('\t') as (id:int,name:chararray,desig:chararray); a2 = load '/user/training/abhi

    1熱度

    3回答

    我正在嘗試使用Hadoop和Apache Pig。我有一些數據和腳本中的.txt文件.pig與我的腳本文件: student = LOAD '/home/srv-hadoop/data.txt' USING PigStorage(',') as (id:int, firstname:chararray, lastname:chararray, phone:chararray, city:

    -1熱度

    1回答

    我的問題是,如果有一種方法可以從script2.pig訪問sript1.pig中的關係「data1」版本,而無需再次加載數據? script1.pig具有: data1 = LOAD '$some_location'USING PigStorage('\t') AS (...); RUN script2.pig; EXEC; script2.pig有: filter1 = FILTER dat

    0熱度

    1回答

    袋子上用枚舉 我嘗試使用下面的代碼來枚舉袋: DEFINE Enumerate datafu.pig.bags.Enumerate('1'); group = GROUP data1 By (query_text); ranked = FOREACH group { ordered = ORDER data1 BY score DESC;

    -1熱度

    1回答

    卸妝數據考慮CSV數據的以下兩行: 01-15-2014 12:04:05, row1 2014/02/20, row2 第1行具有所需的時間戳格式MM-DD-YYYY HH:MM:SS。第2行時間戳需要轉換爲匹配。那麼我怎樣才能完成這項任務。

    0熱度

    1回答

    空行我有一個數據集,像一擊: 1,abc,10000 ,zxcv,2000 , , , 4,xyz,50000 我想輸出,如: 1,abc,10000 zxcv,2000 4,xyz,50000 我怎樣才能實現這個任務? 即我想刪除空行和null值。

    -1熱度

    1回答

    我有一個單一的文件中的以下數據 "HD",003498,"20160913:17:04:10","D3ZYE",1 "EH","XXX-1985977-1",1,"01","20151215","20151215","20151229","20151215","2304",,,"36-126481000",1340.74,61808.00,1126.62,0.00,214.12,0.00,0.0