2017-04-13 1341 views
0

我想知道我應該如何解釋套索迴歸的輸出。舉個例子:解釋Lasso迴歸p值與係數

library(lasso2) 
lm.lasso <- l1ce(mpg ~ . , data=mtcars) 
summary(lm.lasso)$coefficients 

輸出是:

   Value Std. Error  Z score Pr(>|Z|) 
(Intercept) 36.01809203 18.92587647 1.90311355 0.05702573 
cyl   -0.86225790 1.12177221 -0.76865686 0.44209704 
disp   0.00000000 0.01912781 0.00000000 1.00000000 
hp   -0.01399880 0.02384398 -0.58709992 0.55713660 
drat   0.05501092 1.78394922 0.03083659 0.97539986 
wt   -2.68868427 2.05683876 -1.30719254 0.19114733 
qsec   0.00000000 0.75361628 0.00000000 1.00000000 
vs   0.00000000 2.31605743 0.00000000 1.00000000 
am   0.44530641 2.14959278 0.20715850 0.83588608 
gear   0.00000000 1.62955841 0.00000000 1.00000000 
carb  -0.09506985 0.91237207 -0.10420075 0.91701004 

如果我理解正確,套索迴歸應該基本上最小化並不是那麼重要的模式,使它們的係數基本功能零。這對於qsec,vsgear功能是有意義的。然而,p值是非常微不足道的。

如果我有一個基本爲零的係數,但p值接近1,我應該信任哪個值?我應該放棄模型中的特徵,因爲它的係數是零,或者從模型中丟棄它,因爲它的p值是微不足道的?

回答

2

零假設是變量係數等於零並且對模型沒有影響。爲了拒絕零假設,您需要使p值低於.05,值越小,您拒絕拒絕虛假設的可信度越高。

因此,如果值爲1.00,那麼在評估p值時,這意味着在拒絕零假設(它是零影響係數)中沒有置信度。

因此,在您的模型中,迴歸將係數降至零,p值爲1,它支持您瞭解套索如何將非影響值降低爲零係數。你應該相信零和一個!