該DOC https://spark.apache.org/docs/1.1.0/submitting-applications.html羣集部署模式應該使用什麼條件而不是客戶端?
描述部署模式爲:
--deploy-mode: Whether to deploy your driver on the worker nodes (cluster) or locally as an external client (client) (default: client)
使用該圖fig1
作爲引導(從http://spark.apache.org/docs/1.2.0/cluster-overview.html截取):
如果我開球一個火花工作:
./bin/spark-submit \
--class com.driver \
--master spark://MY_MASTER:7077 \
--executor-memory 845M \
--deploy-mode client \
./bin/Driver.jar
然後Driver Program
將MY_MASTER
如fig1
MY_MASTER
相反,如果我使用--deploy-mode cluster
則Driver Program
將工作者節點之間共享指定?如果這是真的,那麼這是否意味着fig1
中的Driver Program
框可以被丟棄(因爲它不再被利用),因爲SparkContext
也將在工作節點之間共享?
應該使用什麼條件cluster
而不是client
?
在客戶端模式的子彈點,爲什麼你說:?「爲振興/調試更容易」 – enneppi 2017-01-26 23:28:48
所以,它聽起來像:客戶端模式意味着司機是哪個機火花提交我是不是跑了?因此,如果有羣集,並且部署模式是客戶端,驅動程序將是您提交的計算機,並且只要羣集配置正確,它將在羣集上並行運行?另外,它聽起來像:集羣模式意味着您在NEEDS上提交的機器是主節點? – 2017-03-08 14:06:00