有一個這樣的DF:熊貓to_datetime()函數的性能問題
Dat
10/01/2016
11/01/2014
12/02/2013
列「逸」有對象類型,所以我嘗試使用to_datetime()熊貓將其切換到日期時間函數的方式:
to_datetime_rand = partial(pd.to_datetime, format='%m/%d/%Y')
df['DAT'] = df['DAT'].apply(to_datetime_rand)
一切正常,但我有性能問題,當我的DF高於20億行。所以在這種情況下,這種方法可能會陷入困境,並且效果不佳。
pandas to_datetime()函數是否可以通過chunck進行轉換,也可以通過循環進行迭代轉換。
謝謝。
日期是唯一的嗎?如果沒有,你可以使用一個字典存儲新的日期時間值和字符串,所以它不需要轉換,如果它看到日期之前,另外任何原因,你不能只是'df ['DAT'] = pd.to_datetime (df ['DAT'],format ='%m /%d /%Y')'? – EdChum
絕對不要使用'.apply' –