如何按小時對數據進行分組？

我看了我的數據轉化爲R，在這裏我感到小時，下面的代碼試圖組我的數據：如何按小時對數據進行分組？

tweets <- read.csv("tweetCSV.csv", header = TRUE, sep = ",", stringsAsFactors = FALSE) 

tweets %>% 
group_by(format(Time, "%H"), Word) %>% 
summarise(count=n())

當我運行這段代碼，我得到它，我不能得到一個錯誤（如下圖所示），我頭圍：

「錯誤mutate_impl（。數據，點）：無效‘微調’說法」

我想知道是否有人能幫助我解決這個問題？

感謝詹姆斯

數據集的樣品是通過此鏈接訪問：https://docs.google.com/spreadsheets/d/1JhXEyzkjPs59hVgoS3lW7e0Fcumis62QDUvuMP2q5aQ/edit?usp=sharing

來源

2017-04-06 jr134

這爲我工作：

tweets %>% 
    mutate(Time = as.POSIXct(Time)) %>% 
    group_by(lubridate::hour(Time), Word) %>% 
    summarise(count=n()) %>% 
    arrange(desc(count))

將其轉換爲POSIXct讓您使用lubridate的小時功能這很方便。

來源

2017-04-06 18:29:21

謝謝你的作品，真的很感謝幫助:-)我一直在花時間來讓這個工作。 @Adrian Martin我想知道是否有任何好消息來了解更多有關使用dplyr和lubridate的信息？ – jr134

我分別學到了它們。需要一點時間才能舒適地使用dplyr。 Lubridate的學習非常簡單 - 只需在數據上隨時調用「str（）」來找出所有類都是什麼類。我建議在這裏使用dplyr上的RStudio備忘單：https：//www.rstudio.com/resources/cheatsheets/。 –

如何按小時對數據進行分組？

回答

相關問題