2014-12-08 105 views
0

同事中間,蜂巢查詢被陷在執行

我面臨的一個問題,而在蜂巢SQL腳本文件的bash執行 - 它總是停留在同一個地方的地圖= 100%,減少= 67%

我試圖映射器玩和減速器數量與不同的變化和其他tunning特點:

SET hive.exec.parallel=true; 
SET hive.default.fileformat=RCFILE; 
SET hive.stats.autogather=false; 
SET hive.exec.compress.output=true; 
SET mapred.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec; 
SET mapred.output.compression.type=BLOCK; 
SET hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat; 

但結果還是一樣 - 它不斷地返回減少進度的67%。

蜂巢版本 - 0.13.0.2.X.X.X

SQL包含表創建從多個源 - 簡單連接幾個表的。

任何想法如何調整?

任何幫助將不勝感激。

+0

也許這將是有益的 - 輸出信息http://www.filedropper.com/response – 2014-12-08 04:38:47

+0

如何對提供的答案(S)的一些反饋? – javadba 2014-12-31 17:57:47

回答

0

因此,發現有幾個重複的記錄,這是執行被卡住的原因。

+0

那麼..那麼我的回答是正確的.. – javadba 2015-02-10 05:17:17

2

一個減速的階段是:

  • 洗牌
  • 排序
  • 減少

陷入@ 67%,表明隨機播放和排序已經完成,但沒有你的分區能夠在Reduce階段取得成功。 Reduce階段是您實際的Reducer代碼。這表明您的代碼無法完成。您應該檢查您的代碼,並查看配置單元日誌以瞭解代碼無法運行的原因。