2017-02-12 62 views
0

如果我想長時間運行EMR集羣,之後我想設置數據管道在集羣上做某些事情,我該怎麼做?在長時間運行的EMR集羣上設置AWS數據管道

我必須在此EMR集羣上安裝Task Runner?或者,也許任務亞軍將預裝?或者也許有其他簡單的方法?

回答

2

Task Runner未預先安裝在EMR中。必須手動配置它,請按照這些steps在EMR羣集中安裝Task Runner。

啓動Task Runner過程時,請提供--workerGroup的名稱。該名稱將成爲此EMR羣集的標識符,可用於數據傳送活動中的WorkerGroup字段。

+0

Bootstrap Action可以做到嗎? – lubom

+0

是的,您可以將這些步驟添加爲腳本並將其用於引導操作。 – franklinsijo

+0

你可以發佈你的bootstrap嗎?我有WAITING_FOR_RUNNER狀態。 – lubom