2016-04-14 73 views
0

我正面臨一個荒謬的情況。爲了解決數據缺失問題,我用這個代碼:在R處理丟失的數據

fixed_data <- fetch_data[-which(! complete.cases(train_sample)),] 
train_index <- sample(1:nrow(fixed_data), size = .7*nrow(fixed_data)) 
train_sample <- fixed_data[train_index, ] 
test_sample <- fixed_data[-train_index,] 

然後我檢查分成小的數據行,以確保沒有遺漏值,但仍然缺少值!

length(which(! complete.cases(fixed_data))) 
+0

定義「缺失數據」,是否爲空,NA,其他字符串表示缺失?如果它們是NA,則可以使用'is.na()'來查找包含NA的行。就我所知,字符NA字符串不會被'complete.cases()'看作缺少。所以這可能是一個問題。 – Badger

+1

不是問題相關的,但是「 - (!)」非常難看。 「哪個(...)'更好。你應該提供你的數據,否則人怎麼能幫忙? – nicola

+0

我正在使用它來移除它認爲不完整的所有內容,並且在這樣做之後,它仍將其他一些行視爲不完整。那就是問題所在! –

回答

0

我改變了代碼

fixed_data <- fetch_data[which(complete.cases(fetch_data)),] 

,它的工作現在。多麼愚蠢的錯誤!