2017-04-22 103 views
0

我創建了兩個連續變量收入和費用的線性迴歸模型。前者是自變量,後者是依賴變量。我最初發現模型中存在異方差性,然後考慮數據的擴散,然後計算一個估算函數(Breusch-Pagan測試),該函數計算出p值爲012e2.2e-16。由於這小於0.05的顯着性水平,我拒絕了有同方差的零假設,並得出異方差確實存在的結論。Heteroskedasticity是否已解決?

在試圖糾正我用下面的代碼用於對因變量的Box-Cox變換的異方差:

lmodI = lm(LCF2010$expense ~ LCF2010$income, data=newexcel) #my original Original model 
boxcox(lmodI, lambda = seq(0,0.5,0.1)) #Found the ideal lambda value to be 0.35 
newexcel <- cbind(newexcel, newexcel$expense^0.35) #Added the new variable to the original dataframe 
names(newexcel)[14] <- "Yprime" #Changed the column name to "Yprime" 
lmodINew <- lm(Yprime ~ income, data=newexcel) #Created the new linear model 

然後我決定把舊模式比較新的,看看我糾正異方差 - 創建以下診斷圖:

原始模型: original model

新模式: new model

我還對新模型進行了Breusch-Pagan測試,發現p值在p值爲< 2.2e-16時保持不變。這和我看不出這兩個診斷地塊之間差異很大的事實讓我感到困惑,因爲我期望我用來解決異方差的方法。

我預計新模型的p值高於0.05,所以我不能拒絕零假設,因此具有同方差性。在盒式轉換過程中我做錯了什麼?

+2

[FYI](https://stats.stackexchange.com/questions/78839/how-should-tiny-p-values-be-reported-and-why-does-r-put-a-minimum-on -2-22e-1) – Sotos

+0

AIC如何從一個型號變爲另一個型號? –

回答

2

從你的情節看來,你有幾百個觀察。請記住,Breusch-Pagan測試本質上是觀測次數R平方的數量,其中R平方來自迴歸器上殘差的輔助迴歸(參見Wooldridge 2015中的等式[8.16])。如果n很大,則此統計量將始終拒絕零假設。

相關問題