我有一個龐大的視頻數據集,我使用名爲process.py
的python腳本進行處理。問題是處理包含6000個視頻的所有數據集需要很長時間。所以,我想出了分割該數據集例如爲4個的想法和相同的代碼複製到不同的Python腳本(例如process1.py
,process2.py
,process3.py
,process3.py
)並運行每一個在不同的外殼與所述數據集的一個部分。運行Python腳本並行
我的問題是會帶來我什麼在性能方面?我有一個10核心的機器,所以如果我能夠利用這種多核結構,這將是非常有益的。我聽說有關Python的multiprocessing
模塊,但不幸的是,我不太瞭解它,並且考慮到我將使用它的功能,我沒有編寫我的腳本。在不同的shell中啓動每個腳本的想法是無意義的嗎?有沒有辦法選擇每個腳本使用哪個核心?
哪些操作系統?例如,Windows或Linux。 –
Linux(Ubuntu 14.04)。 – chronosynclastic