2017-07-08 130 views
1

在具有「ignore_const_cols」參數的h2o模型中,如何針對缺失值確定「常量」?ignore_const_cols缺失值

即,如果一列只有一個唯一的非缺失值和一些缺失值,並且選擇了「ignore_const_cols」,那麼在該列上將不會出現分裂以將缺失值與一個常量值分開?

回答

2

這是很容易測試這個

R代碼裏面:

library(h2o) 
h2o.init() 
iris_data<-as.data.frame(iris) 
iris_data$Petal.Width<-1 
iris_data[iris_data$Species=='setosa','Petal.Width']<-NA 
iris_h2o<-as.h2o(iris_data) 
h2o.gbm(training_frame=iris_h2o,y='Species') 
iris_data$Petal.Width<-as.factor(iris_data$Petal.Width) 
iris_h2o<-as.h2o(iris_data) 
h2o.gbm(training_frame=iris_h2o,y='Species') 

無論是否有缺失值常數列是數字或因素,給出了同樣的警告:

Warning message: 
In .h2o.startModelJob(algo, params, h2oRestApiVersion) : 
    Dropping constant columns: [Petal.Width]. 

因此,您的問題的答案似乎是,當確定列是否爲常數時,h2o忽略缺失值