2013-05-07 136 views
2

嗨,我使用下列R-腳本來建立一個隨機森林不允許在我的數據中沒有發生NA。隨機森林的錯誤NA在預測

參考這裏是我的數據:

https://docs.google.com/file/d/0B0iDswLYaZ0zUFFsT01BYlRZU0E/edit 

沒有人知道爲什麼被拋出這個錯誤?我會一直在尋找。 在此先感謝您的幫助!

+0

您是否嘗試調用建模功能通常式的辦法,即'隨機森林(V1〜。,數據= QdataTrain)'?它是否會帶來同樣的問題? – 2013-05-07 11:28:08

+0

嘗試'回溯()'還有:運行腳本,當它出現故障,鍵入'回溯()'作爲下一個命令來查看正是子命令或函數拋出這個錯誤。 – 2013-05-07 11:40:06

+0

我無法重現的錯誤(我評論全部測試相關數據) – Nishanth 2013-05-07 11:47:27

回答

4

給定的數據包含一定的缺失值(尤其是7):

sapply(QdataTrainX, function(x) sum(is.na(x))) 

## V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 
## 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
## V17 V18 V19 V20 V21 V22 V23 V24 V25 V26 V27 V28 V29 
## 0 0 0 0 0 0 1 1 1 1 1 1 1 

因此列V23到V29具有一個缺失值每

which(is.na(QdataTrainX$V23)) 

## 318 

給出的行號爲。

+0

感謝...應該知道,而不是隻眼球更好。 – brucezepplin 2013-05-07 13:14:47