2017-02-24 63 views
1

我不確定是否需要爲此提供可重現的輸出,因爲這是更常見的問題。無論如何,在運行鼠標包後,它會返回多個推測數據集的m。我們可以使用complete()函數來提取數據。哪個MICE推測數據集用於後續分析?

但是,我很困惑,哪個數據集應該用於我的成功分析(描述性估計,模型構建等)。

問題: 1.我是否需要提取特定數據集,例如complete(imp,1)?或者我應該使用整個估算數據集,例如complete(imp, "long", inc = TRUE)

  1. 如果是後者complete(imp, "long", inc = TRUE),我該如何計算一些描述如平均值,比例等?例如,我將使用SPSS分析長數據。我應該根據m估算的數據集數來拆分數據,然後手動查找平均值?那應該怎麼辦?

感謝您的幫助。

回答

2

您應該分別對每個m估算數據集運行統計分析,然後將結果彙總在一起。這使您可以考慮插補程序引入的額外不確定性。 MICE具有此功能內置例如,如果你想要做你會做這樣一個簡單的線性模型:

fit <- with(imp, lm(y ~ x1 + x2)) 
est <- pool(fit) 
summary(est) 

退房?pool?mira

0

多重插補由以下三個步驟:

1. Imputation 
2. Analysis 
3. Pooling 

在第一步驟中,生成m數插補數據集的,在第二步驟中的數據分析,如迴歸被單獨應用到每個數據集。最後,在第三步中,分析結果彙集成最終結果。針對不同的參數實現了各種池化技術。 這是一個很好的鏈接,詳細描述了池 - mice Vignettes