2017-04-05 63 views
2

所以我想運行我mrjob但得到的第一行錯誤:無法導入電子病歷mrjob

ImportError: No module named mrjob.job 

我發動工作,如下所示:

python main.py --bootstrap-mrjob -v -r emr --emr-job-flow-id j-XXXXXXXXX ../data/data.txt 

我也嘗試在我的mrjobs.conf中添加以下行:

bootstrap: 
- sudo pip install mrjob 

它不起作用。 那麼如何解決它?

編輯: 其實我沒有得到這個錯誤,如果我從命令行創建集羣,但如果我想在已經運行的集羣上運行腳本,它會失敗,並出現此錯誤。

編輯: 所以一個更不同的是,從命令行創建的集羣,我有以下的步驟

PENDING (cluster is BOOTSTRAPPING: Running bootstrap actions) 

但已經運行的羣我沒有它

回答

0

你需要明確地傳遞mrjobs.conf:-c mrjobs.conf

+0

我做了,它沒有幫助 – mirt

+0

我看到了您的編輯,如果集羣已經在運行,那麼您不必引導mrjob,因爲它已經在啓動時自引導個CLU ter被創建。 – Bill