2013-08-03 41 views
0

三個測量(時間)嵌套在嵌套在人員(ID)中的Networkpartners(NP)中。變量NP.T(根據回答here創建)指示特定人員(ID)具有特定度量(1到3)的網絡夥伴的數量(結果中沒有缺失值)。用於重複測量縱向的平均值,方差分析

這是我的數據集的一個例子,真正的數據集有數千行。

ID NP Time Outcome NP.T 
1 1 11 1  4 2 
2 1 12 1  2 2 
3 1 11 2  3 2 
4 1 12 2  3 2 
5 1 11 3  NA 1 
6 1 12 3  3 1 
7 2 21 1  2 2 
8 2 22 1  4 2 
9 2 21 2  NA 1 
10 2 22 2  4 1 
11 2 21 3  NA 1 
12 2 22 3  4 1 

我想計算下面的東西和DONOT知道如何正確地做到這一點:

一)平均,SD在每次測量(NP.T)networkpartners的數量。

此外,我對每次測量時至少命名一個Networkpartner的人數(ID)感興趣。

T1 - > 2點的ID命名至少一個Networkpartner

T2 - > 2點的ID命名至少一個NP

T3 - > 2點的ID命名至少一個NP

這可能聽起來微不足道在這個例子中,但它不在我的示例中。爲了計算手段,sds等。每次我只想在那個特定時間只考慮那些實際命名至少一個網絡夥伴的ID。在特定時間沒有命名任何NP的ID不應該成爲該時間點描述性統計的一部分。 澄清:如果在輸出變量上存在NA,則意味着該NP在該時間點沒有被它的ID命名。

B)reapeated測量方差分析,以找出是否的networkpartners變化在時間

一些預期結果的平均數:

Mean.T1 = 2 < - 既是標識了兩個名爲納米粒子在T1

Mean.T2 = 1.5 < - 爲一個ID已命名的兩個中的另一個在NP T2

Mean.T3 = 1 < - 既是ID的已命名的一個NP在T3

n.T1 = 2

n.T2 = 2

n.T3 = 2

的問題是,在現實的數據集的所有人員命名不同量Networkpartners的,所以我不知道如何計算這種情況下的描述性統計。

+0

你想NP.T或NP的意思嗎?這不是更清晰的給我!如果可能的話,請張貼在你的問題中給定的樣本預期的輸出。 – Metrics

+0

預期結果出現錯誤,我現在糾正了它 – user2647568

+1

您想要'tapply','aggregate'和/或'by'。 –

回答

1

部分A(1 & 2)

library(plyr) 
mydata3<-ddply(mydata1,.(Time),summarize,mean=mean(NP.T),sd=sd(NP.T),nobs=length(unique(ID))) 


> mydata3 
    Time mean  sd nobs 
1 1 2.0 0.0000000 2 
2 2 1.5 0.5773503 2 
3 3 1.0 0.0000000 2 

部分B:

myaov <- aov(mean ~ Time, data=mydata3)

> myaov 

    Call: 
     aov(formula = mean ~ Time, data = mydata3) 

    Terms: 
        Time Residuals 
    Sum of Squares 0.5  0.0 
    Deg. of Freedom 1   1 

    Residual standard error: 1.17148e-16 
    Estimated effects may be unbalanced 

Uodated:對於錯誤Error in is.list(by) : 'by' is missing,請檢查here爲DETA ILS。正如在網站中提到的,這個問題不是RStudio的問題,而是Hmisc庫從包'plyr'掩蓋功能summarize的問題。

因此,您需要在前面的代碼中添加library(Hmisc)

library(plyr) 
library(Hmisc) 
    mydata3<-ddply(mydata1,.(Time),summarize,mean=mean(NP.T),sd=sd(NP.T),nobs=length(unique(ID))) 
+0

編輯我的問題 – user2647568

+0

請解釋這些是什麼意思:n.T1 = 2,n.T2 = 2 n.T3 = 2 – Metrics

+0

n.T1 = 2 - >兩個ID至少爲1每個T1都有NP,因此在計算描述性統計時考慮到了 – user2647568

相關問題