2017-04-26 136 views
3

我希望連接到遠程集羣並執行Spark進程。 所以,從我讀過的,這是在SparkConf中指定的。Scala Spark連接到遠程集羣

val conf = new SparkConf() 
    .setAppName("MyAppName") 
    .setMaster("spark://my_ip:7077") 

其中my_ip是我的羣集的IP地址。 不幸的是,我拒絕了連接。所以,我猜測必須添加一些憑證才能正確連接。我將如何指定憑證?看起來它會用.set(key,value)完成,但是沒有關於這方面的線索。

+0

你連接到星火獨立集羣或紗線進行設置? – jamborta

+0

@jamborta我正在連接紗線 –

+0

嘗試爲ssh會話創建證書並確保它能正常工作,並檢查防火牆是否允許此端口連接 – Pavel

回答

2

有兩樣東西丟失:

順便說一句,這會工作,如果你使用​​提交作業,編程它更復雜,實現它,只能用yarn-client模式,這是棘手的設置遠程控制。

0
  1. 爲了使用火花,你應該在應用程序初始化配置,使用--master yarnspark-submi噸命令或setMaster("yarn")推出紗線的應用。
  2. 如果情況發送從遠程主機"spark-submit"命令可用於popuar Java Secure Channel (JSCH)當然環境參數應在集羣已經