4
在YARN上運行Spark,集羣模式。紗YARN上的Spark:執行沒有worker的驅動程序
- 3數據節點
- YARN => 32個vCores,32 GB RAM
我提交火花方案是這樣的:
spark-submit \
--class com.blablacar.insights.etl.SparkETL \
--name ${JOB_NAME} \
--master yarn \
--num-executors 1 \
--deploy-mode cluster \
--driver-memory 512m \
--driver-cores 1 \
--executor-memory 2g \
--executor-cores 20 \
toto.jar json
我可以看到2個作業在2個節點上運行良好。但是我還可以看到另外兩個只有驅動程序容器的工作!
是否有可能無法運行驅動程序,如果沒有對工人的任何資源?