0
我使用MpaReduce
基於hadoop 2.6.0
,我想跳過前六行我的數據文件的,所以我用默認情況下,MapReduce的輸入鍵是什麼?
if(key.get()<6)
return ;
else
{do ....}
我
map() function
。
但它是不正確的。我發現map()
的input key
不是文件行的offset
。關鍵是每一行的長度的總和。爲什麼?它看起來不像許多書中的單詞。
謝謝你的回答! – FlashXT