0
我正面臨一個荒謬的情況。爲了解決數據缺失問題,我用這個代碼:在R處理丟失的數據
fixed_data <- fetch_data[-which(! complete.cases(train_sample)),]
train_index <- sample(1:nrow(fixed_data), size = .7*nrow(fixed_data))
train_sample <- fixed_data[train_index, ]
test_sample <- fixed_data[-train_index,]
然後我檢查分成小的數據行,以確保沒有遺漏值,但仍然缺少值!
length(which(! complete.cases(fixed_data)))
定義「缺失數據」,是否爲空,NA,其他字符串表示缺失?如果它們是NA,則可以使用'is.na()'來查找包含NA的行。就我所知,字符NA字符串不會被'complete.cases()'看作缺少。所以這可能是一個問題。 – Badger
不是問題相關的,但是「 - (!)」非常難看。 「哪個(...)'更好。你應該提供你的數據,否則人怎麼能幫忙? – nicola
我正在使用它來移除它認爲不完整的所有內容,並且在這樣做之後,它仍將其他一些行視爲不完整。那就是問題所在! –