2011-11-23 186 views
0

在使用part-m-0000 *這樣的名稱創建每個作業空文件之後的HDFS處理中。這些文件中的每一個都是空的,但它們佔用了64MB的磁盤空間,因爲這是塊的默認大小。需要擺脫HDFS中的part-m-0000 *文件

需要更改代碼以跳過這些文件的創建。我該怎麼做呢?

注:我使用org.apache.hadoop.mapreduce.lib.output.MultipleOutputs<KEYOUT,VALUEOUT>寫輸出記錄,並沒有上下文,所以我反正與輸出記錄在像「成功-M-00000」等

回答