1
A
回答
0
按照Hadoop - The Definitive Guide
多的作家,任意文件修改
文件中HDFS可以由單一的作家寫。寫入始終在文件的末尾 處進行。不支持多個寫入程序或在文件中修改 任意偏移量。 (這可能會在將來得到支持,但他們 可能是相對低效的。)
這實際上是不可能的應用級同步,因爲Hadoop的性質(多節點/映射器/減速等) 。
MapR distribution of Apache Hadoop支持隨機讀取和寫入,同時支持多個讀取器和寫入器。
0
HDFS文件不可變。所以你只能追加到他們。 併發追加的問題在這裏涵蓋:Is it possible to append to HDFS file from multiple clients in parallel? 簡而言之 - 你不應該。
我還要指出,這不是「精神領域」。如果你想從一個mappers收集一些數據並將它們聚合在一起 - 這就是reducer的作用。