第一個問題:我想知道拆分是否以任何方式更改塊(即更改大小,將塊移到其他位置,創建新塊,...)。像Haddop中的FileSplit這樣的分割是否會改變塊?
第二個問題:我認爲拆分不會改變塊,但它指定每個MapTask應該是存在於數據或機架的意識,因爲的DataNodes已經在運行的局部性的集羣上運行,並且具有塊所以我認爲的分裂將告訴Hadoop在包含數據的節點旁邊運行MapTask。注意:在InputSplit中有我認爲用於此目的的位置/主機。 請糾正我,如果我錯了
三問題:開始之前,實際執行的任務,將塊移動到該MapTask是或MapTask將移至塊在哪裏(即數據管理部的位置)?
偉大的答案,謝謝。 –