2017-04-06 66 views
0

我看了我的數據轉化爲R,在這裏我感到小時,下面的代碼試圖組我的數據:如何按小時對數據進行分組?

tweets <- read.csv("tweetCSV.csv", header = TRUE, sep = ",", stringsAsFactors = FALSE) 

tweets %>% 
group_by(format(Time, "%H"), Word) %>% 
summarise(count=n()) 

當我運行這段代碼,我得到它,我不能得到一個錯誤(如下圖所示),我頭圍:

  • 「錯誤mutate_impl(。數據,點):無效‘微調’說法」

我想知道是否有人能幫助我解決這個問題?

感謝詹姆斯

數據集的樣品是通過此鏈接訪問:https://docs.google.com/spreadsheets/d/1JhXEyzkjPs59hVgoS3lW7e0Fcumis62QDUvuMP2q5aQ/edit?usp=sharing

回答

2

這爲我工作:

tweets %>% 
    mutate(Time = as.POSIXct(Time)) %>% 
    group_by(lubridate::hour(Time), Word) %>% 
    summarise(count=n()) %>% 
    arrange(desc(count)) 

將其轉換爲POSIXct讓您使用lubridate的小時功能這很方便。

+0

謝謝你的作品,真的很感謝幫助:-)我一直在花時間來讓這個工作。 @Adrian Martin我想知道是否有任何好消息來了解更多有關使用dplyr和lubridate的信息? – jr134

+0

我分別學到了它們。需要一點時間才能舒適地使用dplyr。 Lubridate的學習非常簡單 - 只需在數據上隨時調用「str()」來找出所有類都是什麼類。我建議在這裏使用dplyr上的RStudio備忘單:https://www.rstudio.com/resources/cheatsheets/。 –

相關問題