我通過mrjob/boto模塊將代碼發送到亞馬遜的EMR。我有一些外部python依賴項(即numpy,boto等),目前必須下載python包的源代碼,並將它們作爲tar包發送到mrjob.config文件的「python_archives」字段中。EMR上的Python依賴關係管理
這使得依賴管理比我想要的更混亂,並且想知道我是否可以以某種方式使用與我的virtualenv安裝程序相同的requirements.txt文件來引導emr實例和我的依賴項。是否有可能建立在EMR實例的virtualenv的和做的是這樣的:
pip install -r requirements.txt
,我會在本地?