2016-10-11 51 views
0

我在s3中加載製表符分隔的文件,在spark中創建一個數據框。我需要獲取數據幀中每條記錄的輸入文件名信息以供進一步處理。我試過如何獲取火花數據框中記錄的輸入文件名?

dataframe.select(inputFileName()) 

但是我得到了input_file_name的空值。有人請幫我解決這個問題。

回答

1

可以使用withColumninput_file_name創建數據幀上一個新列:

dataframe.withColumn("input_file", input_file_name) 
+0

小錯字'dataframe.withColumn( 「INPUT_FILE」,input_file_name())' – markop

相關問題