0
我是Hadoop的新手,想知道如何寫入通用輸出文件以存儲有關最近執行的作業的元數據。在文件中存儲有關Hadoop作業的信息
目前如果我正在處理文件a,b,c和d;我有一個自定義計數器,它添加了有關文件數量的信息,但我想知道所有已處理的文件名。
對最好的方式做任何評論呢? 分佈式緩存可以幫助嗎?
我是Hadoop的新手,想知道如何寫入通用輸出文件以存儲有關最近執行的作業的元數據。在文件中存儲有關Hadoop作業的信息
目前如果我正在處理文件a,b,c和d;我有一個自定義計數器,它添加了有關文件數量的信息,但我想知道所有已處理的文件名。
對最好的方式做任何評論呢? 分佈式緩存可以幫助嗎?