我希望有人能夠給我提供一些指導或幫助。我有一個數據集,其中包含一個在三年內已經過感染測試的人羣。一些人(不是全部)在一年多以前被抽樣(因此它們代表重複測量)。我想確定感染的流行是否隨着時間的推移而變化,但是我正在麻煩決定適當的測試。一個簡單的應急測試違反了獨立性的假設,因爲跨越多年重複的個人。我不認爲Cochran-Mantel-Haenszel測試或McNemar Chi-square測試是合適的,但如果我錯了,請隨時糾正我。這裏是我正在使用的數據集,「AnID」變量是代表單個個體的因素(因此如果多年抽樣一個人,您會看到該數字重複2或3次)。用重複測量對數據進行應急測試
我認爲,一個可行的辦法是隨機重新採樣數據多次(無需更換),每次只包括一個單獨的一次,整個年執行應急測試。如果沒有差異的零假設至少在95%的時間內被拒絕,那麼我可以可靠地聲稱存在差異。我還不夠好,還沒有寫出我自己的代碼。預先感謝您提供的任何幫助。
dput(實施例) 結構(列表(ANID =結構(C(37L,37L,45L,45L,45L,55L, 55L,62L,62L,68L,68L,1L,1L,2L, 3L,3L,4L,9L,9L,18L, 18L,18L,19L,19L,19L,20L,20L,21L,22L,22L,23L,24L,24L, 24L,25L,25L,25L,26L, 27L,28L,28L,28L,29L,29L,29L,30L, 31L,32L,32L,33L,34L,35L,36L,38L,38L,39L,39L,40L,41L, 41L,42L,42L, 42L,43L,43L,43L,44L,46L,46L,46L,47L,47L, 47L,48L,48L,48L,49L,49L,49L,50L,51L,52L,52L,53L,53L, 54L, 54L,56L,56L,57L,57L,57L,58L,59L,60L,61L,63L,64L, 65L ,66L,67L,69L,70L,71L,72L,73L,74L,74L,5L,6L,7L, 8L,10L,11L,12L,13L,14L,15L,16L,17L) 「10」, 「11」,「12」,「13」,「136」,「137」,「138」,「139」,「14」,「140」,「141」, 「142」 「143」「144」「145」「146」「147」「26」「27」28「29」 「30」「31」「37」 38,39,40,41,42,43,44,45, ,46,47,48,49,5 50「,51」,52「,」53「,」57「,」58「, 」59「,」6「,」60「,」61「,」62「,」63「 「64」「65」「66」「67」「69」 「7」,「70」,「71」,「72」,「75」,「76」,「77」 「8」「82」「83」「84」 「85」「86」「9」「90」「94」「95」「96」「97」結構(c)(1L,2L,1L,2L,3L,1L,2L,2L,3L,2L, 3L,2L,3L,2L,2L,3L) ,2L,2L,3 L,1L,2L,3L,1L,2L,3L, 2L,3L,2L,1L,2L,2L,1L,2L,3L,1L,2L,3L,2L,2L,1L, 2L,3L, 1L,2L,3L,2L,2L,2L,3L,2L,2L,2L,2L,2L,3L, 2L,3L,2L,2L,3L,1L,2L,3L,1L,2L,3L,2L ,1L,2L,3L, 1L,2L,3L,1L,2L,3L,1L,2L,3L,2L,2L,1L,2L,1L,2L, 1L,2L,1L,2L,1L,2L 3L,3L,3L,3L,3L,3L,1L,1L,1L,1L,1L,1L,1L,1L, 3L,3L,3L,3L,3L),...。標籤= c(「2012」,「2013」,「2014」),class =「factor」), value = c(「Pos」,「Pos」,「Pos」,「Pos」 Neg「,」Neg「, 」Pos「,」Pos「,」Pos「,」Pos「,」Pos「,」Pos「,」Neg「,」Neg「,」Pos「, 」Neg「 Pos「,」Neg「,」Pos「,」Pos「,」Neg「,」Neg「,」Neg「, 」Neg「,」Neg「,」Neg「,」Pos「,」Pos 「Pos」,「Pos」,「Pos」,「Pos」, 「Neg」,「Pos」,「Pos」,「Neg」,「Neg」,「Neg」,「Neg」 ,「Pos」, 「Pos」,「Pos」,「Neg」,「Neg」,「Pos」,「Pos」,「Neg」,「Pos」,「Neg」, 「Pos」 ,「Neg」,「Neg」,「Neg」,「Neg」,「Neg」,「Neg」,「Pos」, 「Pos」,「Pos」 「Neg」,「Neg」,「Pos」,「Neg」, 「Neg」,「Neg」,「Neg」,「Neg」,「Neg」,「Neg」,「Neg」,「Pos」 Pos「, 」Neg「,」Neg「,」Neg「,」Pos「,」Pos「,」Pos「,」Pos「,」Pos 「Neg」, 「Neg」,「Neg」,「Pos」,「Pos」,「Neg」,「Neg」,「Neg」,「Neg」,「Neg」, 「Neg」,「Pos 「Neg」,「Neg」,「Neg」,「Neg」,「Neg」,「Neg」,「Neg」, 「Pos」,「Pos」 ,「Pos」,「Pos」,「Pos」,「Neg」, 「Neg」,「Pos」,「Neg」,「Pos」,「Neg」)),.Names = c(「AnID」年」, 「值」),row.names = 187:306中,class = 「data.frame」)
謝謝!這工作得很好。我已經把你的代碼放在一個循環中來重複這個過程1000次。 – giderk
確保你刪除了'set.seed',以便每次都可以得到不同的隨機數。 – AntoniosK