我們以mpg
數據集爲例,具體爲class
和cyl
列。我可以看到有多少項都在那裏,每單class
,並分化基礎上,共青團值填充顏色:使用ggplot彙總數據
library(ggplot2)
p <- ggplot(mpg)
p <- p + geom_bar(mapping=aes(x=class, fill=factor(cyl)), position=position_dodge())
print(p)
我想看到的,雖然是平均條目數(每class
),每個不同的值cyl
。基本上,如果你看看上面的情節,我想要一個單一的酒吧,其高度應該是該類別的彩色條的平均高度。
我能夠通過預處理數據幀得到這樣的結果,如:
df <- aggregate(formula=cyl~class, data=mpg, FUN=function(x) { length(x)/length(unique(x)) })
p <- ggplot(df)
p <- p + geom_bar(mapping=aes(x=class, y=cyl), stat='identity')
p <- p + ylab('average count')
這讓我所需的輸出:
然而,鑑於GGPLOT2多麼強大,我想知道這是否可以通過ggplot函數。我想這涉及到使用特定的stat
(可能與group=cyl
?),但我無法。
給看看'stat_summary' [鏈接](HTTP://docs.ggplot2 .org/current/stat_summary.html) – user3631369
@ user3631369我正在玩它,但我沒有得到結果。我無法聚集在cyl字段。 – natario