2016-06-21 102 views
2

排序,這是有關排序在numpy的陣列和大熊貓一個基本的問題:numpy的快以比熊貓

我意識到,當我用於排序和選擇的數據幀中的特定列,它幾乎了兩倍熊貓很久以前,我改變了代碼使用numpy數組。

速度變化的原因是什麼?

感謝, 萊昂

如。熊貓:

j = pd.DataFrame(df)   # df columns["date","I",...] 
j = j.sort(["date"], ascending=False) 
x = [[DATES[int(k[1]) - 1]] for k in j["date"].tolist()] 
y = j["I"].tolist() 

例如, Numpy:

j = np.array(df)    # df column["date"] == j[:,0] 
j = np.array(sorted(j, key=lambda a_entry: a_entry[0])) 
x = [[DATES[int(k[1]) - 1]] for k in j[:,0].tolist()] 
y = j[:,4].tolist()   # df column["I"] == j[:,4] 

回答