我想了解group_by
函數的工作方式dplyr
。我正在使用airquality
數據集,它與datasets
包link一起提供。試圖瞭解dplyr函數 - group_by
我理解是,如果我做到以下幾點,就應該安排在Temp
可變
airquality_max1 <- airquality %>% arrange(Temp)
遞增的順序記錄我看到在airquality_max1
的情況。我現在想按照Temp
的順序排列記錄,但是按Month
分組。所以最終結果應該首先按照Temp
的升序排列Month == 5
的所有記錄。然後,它應該有Month == 6
所有記錄中增加Temp
秩序等等,所以我用下面的命令
airquality_max2 <- airquality %>% group_by(Month) %>% arrange(Temp)
不過,我發現的是,結果仍然是增加的Temp
順序而已,不進行分組通過Month
,即,airquality_max1
和airquality_max2
是相等的。
我不知道爲什麼Month
的分組沒有發生在arrange
函數之前。任何人都可以幫助我理解我在這裏做錯了什麼?
除了試圖按列對數據框進行排序的問題之外,我試圖理解group_by
的行爲,因爲我試圖用它來解釋group_by
對某人的應用。
也許你還需要在'arrange'中添加'Month'參數。 'airquality_max2 < - airquality%>%arrange(Month,Temp)' –
排序不是聚合,所以沒有必要使用'group_by' ... – MichaelChirico
我試圖用這個作爲迂腐的例子來顯示'group_by',但偶然發現這種行爲。 – SN248