2012-08-13 53 views
0

我是Hadoop的新手,想知道如何寫入通用輸出文件以存儲有關最近執行的作業的元數據。在文件中存儲有關Hadoop作業的信息

目前如果我正在處理文件a,b,c和d;我有一個自定義計數器,它添加了有關文件數量的信息,但我想知道所有已處理的文件名。

對最好的方式做任何評論呢? 分佈式緩存可以幫助嗎?

回答