0
我們有10個節點HDFS(Hadoop-2.6,cloudera-5.8)羣集,4個磁盤大小爲10TB,磁盤大小爲6TB,節點數爲3TB。在這種情況下,磁盤在小型磁盤節點上不斷充滿,但磁盤在高磁盤大小的節點上可用。針對不同磁盤大小的節點的HDFS數據寫入過程
我試圖理解,namenode如何將數據/塊寫入不同的磁盤大小節點。無論是平分還是寫數據的某個百分比。
我們有10個節點HDFS(Hadoop-2.6,cloudera-5.8)羣集,4個磁盤大小爲10TB,磁盤大小爲6TB,節點數爲3TB。在這種情況下,磁盤在小型磁盤節點上不斷充滿,但磁盤在高磁盤大小的節點上可用。針對不同磁盤大小的節點的HDFS數據寫入過程
我試圖理解,namenode如何將數據/塊寫入不同的磁盤大小節點。無論是平分還是寫數據的某個百分比。
你應該看看dfs.datanode.fsdataset.volume.choosing.policy。默認情況下,它設置爲round-robin
,但由於您有不對稱的磁盤設置,因此應將其更改爲available space
。
你也可以與其他兩個choosing
性能微調的磁盤使用情況。
欲瞭解更多信息,請參閱:
https://www.cloudera.com/documentation/enterprise/5-8-x/topics/admin_dn_storage_balancing.html