2016-12-29 89 views
0

在Pig中設置自定義TextInputFormat分隔符的正確語法是什麼?我已經嘗試了以下幾種變體,但將其視爲字符串值而不是回車換行符。如何在PIG中設置自定義分隔符

set textinputformat.record.delimiter '\r\n'; 

豬版本是0.12.0-cdh5.9.0和Hadoop版本是2.6.0-cdh5.9.0

回答

1

不理想,但解決方法:

創建一個屬性文件一樣myprops.properties包含下面一行:textinputformat.record.delimiter=\r\n

然後運行腳本,如:pig -P ~/myprops.properties -f path/to/pigscript.pig

它看起來像這樣是在第四評論第四段提到一個已知的問題:PIG_4572

0

下面是語法

SET textinputformat.record.delimiter '<delimiter>'; 

這對我的作品

+0

因爲它對待這並不與控制字符工作該值爲一個字符串。 – Shawn

+0

@shawn你有沒有找到解決方案? –