2016-08-19 87 views
0

我目前正在運行在R數據一GLM,我想,如果我使用的最好的模型,以瞭解。使用GLM與泊松或負二項計數資料

我的數據是隨着時間的推移四種蒼蠅,與種類,性別,密度和天存活率計數數據(我重複我的生存計,每5天)爲不同的因素。

我的代碼如下所示:

survival <- cbind(Dead,Alive) 
model1 <- glm (survival ~ Species*density*Sex*day, 
     data = DataM5, family = quasibinomial) 
car::Anova(model1, Type = "III") 
plot(model1) 

我的QQ地塊有大尾巴,我殘差VS擬合曲線看起來非常偏向右側。我明白這是意味着我的變化不是正態分佈(原諒我,如果我沒有這個權利,我作戰了解統計信息,但盡我所能),如果是這樣的話,那麼我的GLM的假設侵犯。從我讀過的內容來看,我認爲我需要使用泊松分佈或負二項式分佈,但是我似乎無法讓它們中的任何一個工作。這是正確的方法嗎?如果它是我如何得到它在R工作?

QQ Plot

Residual vs Fitted Plot

+0

這個問題似乎更多的統計數據除了R編程。因此我將其標記爲被移交給交叉驗證 –

回答

0
  1. 泊松迴歸與日誌鏈接功能通常被用來模擬計數響應
  2. 密度性別*天,要包括所有協變量的相互作用,想想它是否真的有必要。通過使用這個模型,你可能會有一個模型來過濾數據。
  3. 泊松迴歸是GLM(一個或多個)中的一個,但殘差不是assumped爲正態分佈。