2017-11-25 137 views
0

我用CHAID構建了一個模型。現在我想用它來預測一個變量 - 像我將與樹()或軟件rpart()做到這一點:用RID中的CHAID做預測

MA_CHAID <- chaid(Data$target 
       ~ Data$factor1 
       + Data$factor2, 
       control = chaid_control(minprob = 0.001, 
             minsplit = 500,minbucket = 200), 
       data = Data 
       ) 

Data$MA_predict <- predict(MA_CHAID, Data) 

但我收到此錯誤信息:

Error in `$<-.data.frame`(`*tmp*`, MA_predict, value = c(1L, 1L, : 
replacement has 124855 rows, data has 379031 

任何想法?

謝謝!

回答

0

CHAID樹的構建包括具有缺失值的預測變量。

該算法排除了任何缺少值的行。這就是爲什麼這個模型只有一半的案例。

我的下一個嘗試將使用「失蹤」作爲它自己的類別。