我在Python中使用多處理進行並行化。 我想並行化使用大熊貓從Excel文件讀取的數據塊上的進程。python多進程,多進程運行相同的指令
我是新來的多處理和並行處理。在實施過程中對簡單的代碼,
import time;
import os;
from multiprocessing import Process
import pandas as pd
print os.getpid();
df = pd.read_csv('train.csv', sep=',',usecols=["POLYLINE"],iterator=True,chunksize=2);
print "hello";
def my_function(chunk):
print chunk;
count = 0;
processes = [];
for chunk in df:
if __name__ == '__main__':
p = Process(target=my_function,args=(chunk,));
processes.append(p);
if(count==4):
break;
count = count + 1;
打印「你好」正在被執行多次,我猜應該建立在目標工作,而不是主代碼的單個處理器。
任何人都可以建議我,我錯了。