我在Udacity.com上參加了Hadoop和MapReduce的課程,講師提到在HDFS中爲了減少故障點,每個數據塊在數據庫中被複制3次。這是真的嗎?這是否意味着如果我有1 PB的日誌,我需要3 PB的存儲空間?因爲這會讓我付出更多的代價HDFS是否需要數據空間的3倍?
0
A
回答
0
是的。所以說,如果你說有4臺機器上運行着datanode,那麼默認情況下複製也會在其他兩臺機器上隨機發生。如果你不希望出現這種情況,你可以通過在HDFS-site.xml中設置dfs.replication
屬性切換到1
1
是的,是真實的,HDFS要求每個冗餘副本空間,需要拷貝來實現容錯和處理過程中的數據局部性。
但是,這不一定是真實的關於MapReduce,它可以運行在其他文件系統,如S3或Azure blob,例如。 HDFS需要3個副本。
0
這是因爲HDFS在存儲數據時會複製數據。 hdfs的默認複製因子是3,您可以在ddfs.replication屬性下的hdfs-site.xml文件中找到它。您可以根據您的要求將此值設置爲1或5。
數據複製非常有用,就像某些節點特別關閉一樣,您將擁有其他節點/節點上可用的數據副本進行處理。
1
默認情況下,HDFS設置參數dfs.replication
設置值爲3,允許容錯,disponibility,等...(All parameters of HDFS here)
但在安裝時,你可以設置爲1的參數,和HDFS不要複製你的數據。在dfs.replication = 1的情況下,1 PB的存儲空間量相同。
相關問題
- 1. 數據庫中是否需要名稱空間?
- 2. iOS Image資產大小。 3倍實際上是1倍尺寸的3倍,需要Retina 4倍?
- 3. 爪哇 - 是否空變量需要的內存空間
- 4. 數據增強 - 是否需要轉移?
- 5. rpart:是否需要訓練數據
- 6. 默認的XML名稱空間是否需要前綴?
- 7. Git是否需要比SVN更多的空間?
- 8. 是3的倍數的數組編號
- 9. 如果我向數據契約添加了非必需的元素,是否需要新的名稱空間?
- 10. vuex模塊是否仍然需要命名空間?
- 11. Linux是否需要用戶空間堆棧?
- 12. 消耗的HDFS空間:「hdfs dfs -du /」vs「hdfs dfsadmin -report」
- 13. 需要的Azure SQL數據庫空間量
- 14. 我需要數據庫中的空間索引嗎?
- 15. Sql數據右邊不需要的空間
- 16. 表間不需要的垂直空間
- 17. divs之間不需要的空間
- 18. 而不是空的空間需要的連字符
- 19. 如果$ count是3 + 1的倍數php
- 20. 倍數來自一個頁面,需要傳遞數據
- 21. SVN需要多少空間?
- 22. 需要引導循環和倍數
- 23. Mysql數據庫 - 需要3列等於
- 24. 是否需要LDT?
- 25. UINavigationController是否需要?
- 26. 是否需要SQLCipher?
- 27. 是否需要main.cpp?
- 28. 是否需要Zend_Acl?
- 29. 是否需要AudioServicesDisposeSystemSoundID?
- 30. 是否需要UserController?