2011-01-23 63 views

回答

2

dfs -cat必須通過該單一過程穿梭所有數據,並行性較差。

我所做的是運行一個只映射器的流式作業,該作業轉儲到每個磁盤上的臨時空間,然後rsync回到單臺機器。這兩個部分都充分發揮了集羣的作用;並且由於rsync很好地冪等,所以你可以在hdfs-> local部分的同時啓動它。

+0

輝煌。感謝翻轉! – 2011-01-26 04:05:30

相關問題