2014-11-03 60 views
1

我見過的,有是接受頭控制參數豬CSVExcelStorage刪除頭

CSVExcelStorage(String delimiter, String multilineTreatmentStr, String eolTreatmentStr, String headerTreatmentStr) 

但是我還沒有發現什麼是「SKIP_INPUT_HEADER」價值不變的構造函數。

+0

?您可以在加載期間直接將此MACRO傳遞給構造函數。 – 2014-11-03 12:47:48

回答

2

我不知道爲什麼你要SKIP_INPUT_HEADER的恆定值,但如果你的目的是要去除負載時的標題,然後請你爲什麼要「SKIP_INPUT_HEADER」的恆定值,檢查下面的例子

input.csv 
Name,Age,Location 
a,10,chennai 
b,20,banglore 

PigScript:(With SKIP_INPUT_HEADER) 
REGISTER '/tmp/piggybank.jar'; 
A = LOAD 'input.csv' USING org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'UNIX', 'SKIP_INPUT_HEADER'); 
DUMP A; 

Output: 
(a,10,chennai) 
(b,20,banglore) 



PigScript:(Without SKIP_INPUT_HEADER) 
REGISTER '/tmp/piggybank.jar'; 
A = LOAD 'input.csv' USING org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'UNIX'); 
DUMP A; 

OutPut: 
(Name,Age,Location) 
(a,10,chennai) 
(b,20,banglore)