我開始於AWS火花集羣,其中一個主站和60芯:Spark:驅動程序/工作者配置。驅動程序是否在主節點上運行?
這裏是啓動的命令,每個核心基本上2個執行人,完全120執行人:
spark-submit --deploy-mode cluster --master yarn-cluster --driver-memory 180g --driver-cores 26 --executor-memory 90g --executor-cores 13 --num-executors 120
然而,在作業服務器,只有119執行人:
我認爲應該有1個司機+ 120名工人執行者。但是,我看到的是119名執行人員,其中包括1名司機+ 118名執行人員。
這是否意味着我的主節點沒有被使用?驅動程序是否在主節點或核心節點上運行?我可以讓驅動程序在主節點上運行,並讓60個核心託管120個工作執行者?
謝謝!
這是否意味着主節點不是集羣的一部分?那麼主節點做什麼? – Edamame
sparkstandalone中的master(YARN中的資源管理器)僅用於將作業委派給工作人員並跟蹤羣集運行狀況等。您可以在與主服務器相同的方框上部署worker,但如果主節點是隻有服務,沒有執行者會在那裏運行。下面的拉文德拉的帖子有一個精確的架構圖。 –
如果火花驅動程序應用程序正在運行的節點出現故障或重新啓動,Spark集羣模式下的集羣中的另一個工作節點上是否會自動啓動Spark驅動程序? – girip11