1
我已經遇到一個奇怪的性能問題與R.[R過濾以異常高時加載
我有一個csv file包含接近600,00線和11列。最後一列包含日期。我正在嘗試根據最後一列中的日期是週末還是週日來篩選行。正如你從下面的輸出中可以看到的,這個相對簡單的過濾需要12秒。
> library(lubridate)
> data335 = read.csv("data335.csv")
> Sys.time()
[1] "2017-10-29 00:50:16 IST"
> delete_variable = data335[ifelse((wday(data335$ticket_date) %in% c("1","6")), T , F),][11]
> Sys.time()
[1] "2017-10-29 00:50:28 IST"
但是,對其他列值的過濾幾乎不需要一兩秒鐘。
> Sys.time()
[1] "2017-10-29 00:58:58 IST"
> delete_variable = data335[(data335$route_no == "V-335EUP") ,][11]
> Sys.time()
[1] "2017-10-29 00:58:58 IST"
我敢肯定,在前面的過濾案例中,我沒有用R的方式去做。有沒有辦法讓這段時間在2秒內過濾?