我有一個hadoop集羣,我正在使用Numpy,SciPy和Pandas進行數據分析。我希望能夠使用'--file'參數將命令作爲zip/tar文件提交給我的hadoop作業。這個zip文件應該有一切,我的python程序需要執行,無論我的腳本在集羣上執行什麼節點,我都不會在運行時遇到ImportError。如何將依賴的python腳本打包到zip/tar?
由於公司政策,在每個節點上安裝這些庫不是完全可行的,尤其是對於探索性/敏捷開發。雖然我已經安裝了pip和virtualenv來創建沙箱。
我已經看過zipimport和python packaging但這些都不符合我的需求/我在使用這些工具時遇到困難。
有沒有人有這樣做的運氣?我似乎無法在網上找到任何成功案例。
謝謝!
不確定這些特定的依賴關係,但pex在創建一個文件方面效果很好:https://pex.readthedocs.org/en/latest/ –