在Pig中設置自定義TextInputFormat分隔符的正確語法是什麼?我已經嘗試了以下幾種變體,但將其視爲字符串值而不是回車換行符。如何在PIG中設置自定義分隔符
set textinputformat.record.delimiter '\r\n';
豬版本是0.12.0-cdh5.9.0和Hadoop版本是2.6.0-cdh5.9.0
在Pig中設置自定義TextInputFormat分隔符的正確語法是什麼?我已經嘗試了以下幾種變體,但將其視爲字符串值而不是回車換行符。如何在PIG中設置自定義分隔符
set textinputformat.record.delimiter '\r\n';
豬版本是0.12.0-cdh5.9.0和Hadoop版本是2.6.0-cdh5.9.0
不理想,但解決方法:
創建一個屬性文件一樣myprops.properties
包含下面一行:textinputformat.record.delimiter=\r\n
然後運行腳本,如:pig -P ~/myprops.properties -f path/to/pigscript.pig
它看起來像這樣是在第四評論第四段提到一個已知的問題:PIG_4572
下面是語法
SET textinputformat.record.delimiter '<delimiter>';
這對我的作品
因爲它對待這並不與控制字符工作該值爲一個字符串。 – Shawn
@shawn你有沒有找到解決方案? –