2
排序,這是有關排序在numpy的陣列和大熊貓一個基本的問題:numpy的快以比熊貓
我意識到,當我用於排序和選擇的數據幀中的特定列,它幾乎了兩倍熊貓很久以前,我改變了代碼使用numpy數組。
速度變化的原因是什麼?
感謝, 萊昂
如。熊貓:
j = pd.DataFrame(df) # df columns["date","I",...]
j = j.sort(["date"], ascending=False)
x = [[DATES[int(k[1]) - 1]] for k in j["date"].tolist()]
y = j["I"].tolist()
例如, Numpy:
j = np.array(df) # df column["date"] == j[:,0]
j = np.array(sorted(j, key=lambda a_entry: a_entry[0]))
x = [[DATES[int(k[1]) - 1]] for k in j[:,0].tolist()]
y = j[:,4].tolist() # df column["I"] == j[:,4]