Hadoop Mapreduce CombineFileInputFormat在閱讀大量小文件時效果很好,但我一直注意到有時候作業失敗,出現以下情況例外,Mapreduce combinefileinputformat java.lang.reflect.InvocationTargetException當兩個作業訪問相同的數據時
了java.lang.RuntimeException:在 org.apache.hadoop.mapreduce.lib.input.CombineFileRecordReader.initNextRecordReader(CombineFileRecordReader.java:164) java.lang.reflect.InvocationTargetException在 組織.apache.hadoop.mapreduce.lib.input.CombineFileRecordReader.nextKeyValue(CombineFileRecordReader.java:67) 在 org.apache.hadoop.mapred.MapTask $ NewTrackingRecordReader.nextKeyValue在 org.apache.hadoop.mapreduce.task.MapContextImpl.nextKeyValue(MapContextImpl.java:76)(MapTask.java:483) 在 組織.apache.hadoop.mapreduce.lib.map.WrappedMapper $ Context.nextKeyValue(WrappedMapper.java:85) at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:139)at org.apache.hadoop (MapTask.java:672)at org.apache.hadoop.mapred.MapTask.run(MapTask.java:330)at org.apache.hadoop.mapred.Child $ 4.run(Child。 java:268)at java.security.AccessController.doPrivileged(Native Method)at javax.security.auth.Subject.doAs(Subjec (用戶組信息)
我注意到,只有當某個其他mapreduce作業同時在相同的數據上運行時纔會發生這種情況,否則它會按預期工作。
即使在類似條件下運行hive查詢時也會生成相同的異常。
我一直在尋找解決方案或可能的原因。