0
我們有一個要求,我們想要做的CSV文件未成年人改造和寫入相同的使用火花其他HDFS文件夾。
e.g /input/csv1.txt(至少4 GB文件)
ID,Name,Address
100,john,some street
輸出應在文件(輸出/ csv1.txt)。基本上,兩個新列將分析地址後加上(記錄的順序應該是相同的輸入文件)
ID,Name,Address,Country,ZipCode
100,Name,Address,India,560001
貌似沒有簡單的火花做到這一點。
嗨,我們試着運行這個,但是我們在輸出目錄中獲得PART文件(part-00000)。相反,我們需要獲取文件名稱,因爲它在輸出目錄中。 –