我對使用Avro和map reduce非常困惑,無法找到好的教程。使用純文本輸入和avro輸出的mapreduce作業
似乎像AvroJob和AvroMapper這樣的類在輸入和輸出都是Avro數據文件時都會遇到問題。什麼時候你的輸入只是純文本?
具體來說:
我的映射器將LongWritable鍵和Text值作爲輸入。它發出文本鍵和MyAvroRecord值。
我的reducer將MyAvroRecords的Text鍵和Iterator作爲輸入,併發出Text鍵和MyAvroRecord值。
如何獲得將這些文本鍵和MyAvroRecord值寫入文件的OutputFormat?
乾杯,戴夫
戴夫你好,我想做某事相反。我的輸入是文本,輸出是通用記錄。我嘗試爲AvroJob設置Avro輸入模式,然後將輸出模式設置爲通用記錄的模式。但我不知道如何包裝輸入模式,以便AvroJob可以理解它是純文本。我應該只使用setInputSchema()什麼都沒有? – 2014-05-02 01:00:46