0
我在s3中加載製表符分隔的文件,在spark中創建一個數據框。我需要獲取數據幀中每條記錄的輸入文件名信息以供進一步處理。我試過如何獲取火花數據框中記錄的輸入文件名?
dataframe.select(inputFileName())
但是我得到了input_file_name的空值。有人請幫我解決這個問題。
我在s3中加載製表符分隔的文件,在spark中創建一個數據框。我需要獲取數據幀中每條記錄的輸入文件名信息以供進一步處理。我試過如何獲取火花數據框中記錄的輸入文件名?
dataframe.select(inputFileName())
但是我得到了input_file_name的空值。有人請幫我解決這個問題。
可以使用withColumn
和input_file_name
創建數據幀上一個新列:
dataframe.withColumn("input_file", input_file_name)
小錯字'dataframe.withColumn( 「INPUT_FILE」,input_file_name())' – markop