2
所以我想運行我mrjob但得到的第一行錯誤:無法導入電子病歷mrjob
ImportError: No module named mrjob.job
我發動工作,如下所示:
python main.py --bootstrap-mrjob -v -r emr --emr-job-flow-id j-XXXXXXXXX ../data/data.txt
我也嘗試在我的mrjobs.conf中添加以下行:
bootstrap:
- sudo pip install mrjob
它不起作用。 那麼如何解決它?
編輯: 其實我沒有得到這個錯誤,如果我從命令行創建集羣,但如果我想在已經運行的集羣上運行腳本,它會失敗,並出現此錯誤。
編輯: 所以一個更不同的是,從命令行創建的集羣,我有以下的步驟
PENDING (cluster is BOOTSTRAPPING: Running bootstrap actions)
但已經運行的羣我沒有它
我做了,它沒有幫助 – mirt
我看到了您的編輯,如果集羣已經在運行,那麼您不必引導mrjob,因爲它已經在啓動時自引導個CLU ter被創建。 – Bill