在下面的代碼中,我使用引導來計算C.I.以及在零假設下施用於番茄植物的兩種不同肥料對植物產量沒有影響(並且「改良」肥料更好的替代方案)下的p值。第一個隨機樣本(x)來自使用標準肥料的植物,而第二個樣本(y)來自的植物則使用「改良」樣本。引導以比較兩個組
x <- c(11.4,25.3,29.9,16.5,21.1)
y <- c(23.7,26.6,28.5,14.2,17.9,24.3)
total <- c(x,y)
library(boot)
diff <- function(x,i) mean(x[i[6:11]]) - mean(x[i[1:5]])
b <- boot(total, diff, R = 10000)
ci <- boot.ci(b)
p.value <- sum(b$t>=b$t0)/b$R
我不喜歡上面的代碼是什麼好像有11個值(分離第一5爲屬於X離開其餘樣本y採樣)的僅一個樣品重採樣完成。 您可以告訴我如何修改此代碼,以便從第一個樣本中取出大小爲5的重新取樣,並從第二個樣本中取出大小爲6的重新取樣,以便引導重新取樣可以模擬生成的「單獨樣本」設計原始數據?
謝謝!關於你的問題「我爲什麼要這麼做」,請查看第18頁底部的標題爲「用於比較兩個種羣的引導程序」(如果您想對此進行評論),請參閱http://bcs.whfreeman.com /ips5e/content/cat_080/pdf/moore14.pdf – 2010-09-01 08:55:04
我的主要問題是如何定義diff.calc。我很驚訝地看不到裏面的第二個參數! – 2010-09-01 09:00:44
@ gd047:我猜你已經從statexchange上的問題中得到了類似的東西。請注意,他們只說一個置信區間,並沒有提到那裏的p值。我的例子顯示你爲什麼。 – 2010-09-01 09:10:49