我正在使用mrjob編寫地圖函數。我的輸入將來自HDFS目錄中的文件。這些文件的名稱包含一個小的但是至關重要的信息,這些信息不存在於這些文件中。有沒有一種方法可以學習(在map函數中)給定鍵值對來自哪個輸入文件的名稱?如何在MRjob中獲取輸入文件的名稱
我找的這個Java代碼等價物:提前
FileSplit fileSplit = (FileSplit)reporter.getInputSplit();
String fileName = fileSplit.getPath().getName();
謝謝!
和更多信息可以從普利文的前面的回答中找到類似於這樣的問題 - http://stackoverflow.com/問題/ 7449756/get-input-file-name-in-streaming-hadoop-program – 2012-07-11 18:11:58
謝謝,@PraveenSripati和@ChrisWhite,這正是我需要的!明確地爲未來的訪問者聲明:'fileName = os.environ ['map_input_file']'是否有用。 – Bolo 2012-07-11 21:39:12