當使用R的rpart
函數時,我可以很容易地使用它的模型。例如:「anova」(對於lm)是否與rpart對象等價?
# Classification Tree with rpart
library(rpart)
# grow tree
fit <- rpart(Kyphosis ~ Age + Number + Start,
method="class", data=kyphosis)
printcp(fit) # display the results
plotcp(fit)
summary(fit) # detailed summary of splits
# plot tree
plot(fit, uniform=TRUE,
main="Classification Tree for Kyphosis")
text(fit, use.n=TRUE, all=TRUE, cex=.8)
我的問題是 - 我如何測量每個我的三個解釋變量(年齡,人數,開始)模式的「重要性」?
如果這是一個迴歸模型,我可以從「anova」F-檢驗(在lm
模型之間有和沒有變量之間)看p值。但是,如何將lm
上的「anova」與rpart
對象等同使用?
(我希望我能夠清楚地表明我的問題)
謝謝。
感謝gd047, 這是一個非常有益的指導! 我期待着來自人們的其他想法。 謝謝! Tal – 2010-03-07 20:33:04
gd047,我只是到處尋找信息增益措施的R實現 - 我似乎無法找到任何人談論它。 也許我會把R和wekka連接起來。 再次感謝領先! Tal – 2010-03-07 21:52:11