2
我有興趣修改輸入數據分割作業的方式分配給特定節點。分配給節點的作業數據分割如何?
我經歷了hadoop的JobInprogress代碼,但無法知道實際的分配是如何發生的。
作業的輸入拆分如何分佈在集羣的各個節點上?
我需要通過哪些Hadoop文件瞭解分配情況?
我有興趣修改輸入數據分割作業的方式分配給特定節點。分配給節點的作業數據分割如何?
我經歷了hadoop的JobInprogress代碼,但無法知道實際的分配是如何發生的。
作業的輸入拆分如何分佈在集羣的各個節點上?
我需要通過哪些Hadoop文件瞭解分配情況?
感謝praveen的迴應!但是,您的回答是關於如何分配任務以及與其相關的代碼。我對此有點熟悉。 FIFO調度程序中的assigntasks調用會查看這些作業並嘗試獲取localmaptask或非本地作業。這個調用的實現可能不同。但是我有興趣知道在從文件創建分割時如何將數據分割分配給特定的節點?我想要更改此分配以查看在數據節點上執行映射任務時作業執行時間的差異是本地和非本地的。 –