我有一個在類變量中缺少值的測試集。 運行knn時,出現錯誤信息:「knn錯誤(...)不允許缺少值」,爲什麼?
「knn(...)中出現錯誤,不允許缺少值」。
問題:爲什麼不能讓測試集中類變量的值丟失?我的意思是,我不知道這些價值,我想預測它們。 我可以將一些類分配給類變量,並仍然得到正確的結果嗎?
示例代碼:
library(class)
data <- data.frame("class_variable"=sample(LETTERS[1:2], 30, replace = TRUE),
"predictor_1" = runif(30),
"predictor_2" = runif(30))
train <- data[1:20,]
test <- data[21:30,]
test$class_variable <- NA
knn(train, test, train$class_variable)
錯誤KNN(火車,測試,火車$ class_variable): 沒有缺失值被允許