我正在蜂巢插入從具有錯誤:在谷歌數據PROC集羣
13783531
記錄到另一個分區表沒有任何改造的表覆蓋谷歌dataproc羣集上查詢Java堆空間。 ,其失敗,錯誤
Diagnostic Messages for this Task:
Error: Java heap space
FAILED: Execution Error, return code 2 from
org.apache.hadoop.hive.ql.exec.mr.MapRedTask
MapReduce Jobs Launched:
Stage-Stage-1: Map: 34 Cumulative CPU: 1416.18 sec HDFS Read: 6633737937
HDFS Write: 0 FAIL
集羣詳細
n1-standard-16 (16 vCPU, 60.0 GB memory)
用5個工作節點。
錯誤在 之間變化Java堆空間和超出GC開銷限制。 我嘗試設置參數
set mapreduce.map.memory.mb=7698;
set mapreduce.reduce.memory.mb=7689;
set mapreduce.map.java.opts=-Xmx7186m;
set mapreduce.reduce.java.opts=-Xmx7186m;
仍然失敗。
的可能的複製禁止 使用時,將記錄插入錯誤的分區[什麼是Hive:從org.apache.hadoop.hive.ql.exec.MapRedTask返回代碼2(http://stackoverflow.com/questions/11185528/what-is-hive-return-code-2-from-org- apache-hadoop-hive-ql-exec-mapredtask) –
是你的木桌格式表格嗎? – hlagos
@lake表格是 – Freeman