3
我正在EMR上創建集羣並將Zeppelin配置爲從S3讀取筆記本。要做到這一點,我使用JSON對象,看起來像:在啓動集羣時在EMR上配置Zeppelin的Spark解釋器
[
{
"Classification": "zeppelin-env",
"Properties": {
},
"Configurations": [
{
"Classification": "export",
"Properties": {
"ZEPPELIN_NOTEBOOK_STORAGE":"org.apache.zeppelin.notebook.repo.S3NotebookRepo",
"ZEPPELIN_NOTEBOOK_S3_BUCKET":"hs-zeppelin-notebooks",
"ZEPPELIN_NOTEBOOK_USER":"user"
},
"Configurations": [
]
}
]
}
]
我粘貼此對象EMR的Stoftware配置頁: 我的問題是,如何/我在哪裏可以配置星火解釋直接在每次啓動集羣時無需從Zeppelin手動配置它?
非常感謝@ rdeboo。你能否詳細說明什麼是「2ANGGHHMQ」。你能否提供一個設置「spark.yarn.executor.memoryOverhead」爲2048的例子,這是我的情況以及spark.executor.memory和spark.executor.cores – Rami
@Rami這是一些內部密鑰名稱,用於標識相關部分在interpreter.json中。看起來很穩定(我看過很多不同版本的EMR實例)。但是當然不能保證這不會改變。無論如何,我認爲AWS應該修復默認配置,以便我們都可以停止使用此解決方法。 – rdeboo
這是偉大的工作!但在我的情況下需要一個關鍵的調整。使用其餘API重新啓動解釋器似乎沒有在interpreter.json中選擇任何更改。 Zeppelin本身需要重新啓動,至少這發生在EMR上。所以,而不是捲曲它的工作:sudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh重新啓動 –