0
我有套分數的數據幀,並設置分組變量,類似的:嵌套骨料內,向聚集的多個變量的多個列中的R
s1 s2 s3 g1 g2 g3
4 3 7 F F T
6 2 2 T T T
2 4 9 G G F
1 3 1 T F G
我想運行的集合,在我正在做的事情:
aggregate(df[c("s1","s2","s3")],df["g1"],function(x) c(m =mean(x, na.rm=T), sd = sd(x, na.rm=T), n = length(x)))
我想只有一行代碼,所以我可以一次聚合多個變量。請注意,我並不想通過組合g1-3來獲得s1-3的摘要(按照答案here)。我已經在doBy
包中看過summaryBy
,但是似乎再次考慮了每個因素的組合,而不僅僅是一個整體,這不是我想要的(雖然有用!)。我一直玩的變種:
apply(df[c("g1","g2","g3")], 2, function (z) aggregate(df[c("s1","s2","s3")],z,function(x) c(m =mean(x, na.rm=T), sd = sd(x, na.rm=T), n = length(x)))
但我得到的錯誤:'''必須是一個列表「。我想我可以解決如何做到這一點與loop
,我知道與各種版本的ddply
或reshape
你可以得到聚合,但最直觀的方式(對我來說至少)似乎是apply
和aggregate
- 我失去了什麼?
什麼是理想的輸出? – 2015-02-23 17:14:03
我真的不介意,我在做一個清單。我喜歡使用數據框,但它似乎將輸出集重新塑造成df實際上是一個單獨的問題 – sjgknight 2015-02-23 17:16:08
@sjgknight您可以嘗試'lapply(paste0('g',1:3),function(y)aggregate(cbind( s1,s2,s3)〜。,df [c(y,paste0('s',1:3))],function(x)c(mean = mean(x,na.rm = T),sd = sd (x,na.rm = T),n = length(x))))' – akrun 2015-02-23 17:29:00