我有一羣csv文件以某種其他系統的每日提要的形式出現。從csv文件中刪除標題和空白行
我必須從文件中刪除標題和一些可選的空白行,然後將其加載到HDFS並在其上構建外部表。
目前我有兩個步驟的過程,把工作文件上HDFS
//remove blank lines
sed -i '/^\s*$/d' file_20160802.csv
//remove header
sed -i 1d file_20160802.csv
//put file on HDFS
hdfs dfs -put file_20160802.csv /raw/abc/20160802/
之前刪除頁眉和空格有沒有一種方法,我可以結合這兩個步驟,而無需創建任何臨時文件?
謝謝堆@sat !! –