2016-11-21 86 views
0

我有7個組我想運行方差分析測試,以查看彼此之間是否存在基於特徵的顯着差異。我有大約600個特徵。 我已經計算了每組和每個特徵的均值,標準差和方差。七個小組有不同的樣本量。如何安排我的數據,以便我能夠在R中運行它們?在r中運行多個anova測試

回答

1
set.seed(2) 

sampledata <- expand.grid(group = paste0("group", 1:7), trait = paste0("trait", 1:600), value = 1:5) 
sampledata$value <- rnorm(nrow(sampledata)) 

sampledata.aov <- aov(value ~ group * trait, data = sampledata) 
anova(sampledata.aov) 

Analysis of Variance Table 

Response: value 
       Df Sum Sq Mean Sq F value Pr(>F) 
group   6  7.1 1.1784 1.1670 0.32072 
trait   599 658.0 1.0985 1.0878 0.07096 . 
group:trait 3594 3613.0 1.0053 0.9955 0.56604 
Residuals 16800 16964.3 1.0098     
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

即使有隨機數,也會發出警告,當你一次擁有這麼多特性時,你更有可能沒有顯着差異。