針對不同磁盤大小的節點的HDFS數據寫入過程

我們有10個節點HDFS（Hadoop-2.6，cloudera-5.8）羣集，4個磁盤大小爲10TB，磁盤大小爲6TB，節點數爲3TB。在這種情況下，磁盤在小型磁盤節點上不斷充滿，但磁盤在高磁盤大小的節點上可用。針對不同磁盤大小的節點的HDFS數據寫入過程

我試圖理解，namenode如何將數據/塊寫入不同的磁盤大小節點。無論是平分還是寫數據的某個百分比。

你應該看看dfs.datanode.fsdataset.volume.choosing.policy。默認情況下，它設置爲round-robin，但由於您有不對稱的磁盤設置，因此應將其更改爲available space。

你也可以與其他兩個choosing性能微調的磁盤使用情況。

2017-05-26 18:35:41 tk421

回答