在R Studio中執行rpart

2016-06-08 71 views 0 likes

我正在使用泰坦尼克號數據集。我試圖在CABIN欄中填寫空格。我從CABIN列值中提取了第一個字母，然後將它們放在CABIN_NEW列中。之後，我使用rpart進行預測，但每次運行下面的代碼時，R都需要很長時間（還沒完成一次，每次都必須終止）。在R Studio中執行rpart

數據集有1309行，我正在使用的列在代碼中。我使用的系統是在4 GB內存，i5處理器和Window 7

combifit <- rpart(Cabin_New ~ Pclass + Sex + Age + SibSp + Parch + Fare + Embarked + Title 
        + FamilySize + Surname + FamilyID, 
        data = combi[!is.na(combi$Cabin_New),], method = 'class')

來源

2016-06-08 ayush kumar

回答

我看到你已經使用了很多因素變量的運行。請檢查每個因素中存在多少個因子水平。如果這個數字很高，可以說對於姓氏，如果它是100，那麼R將不得不創建100個變量，以此類推。所以我的猜測是，由於這些因素變量，rpart必須研究很多變量，才能決定拆分。因此需要很長時間。

還讀了rpart.control上的一點，因爲rpart的分割次數取決於傳遞給rpart的參數。例如cp就是這樣一個參數。其默認值是0.01。嘗試將其值從0.5更改爲0.1。與其他參數類似地玩，你可能能夠更快地運行rpart。

來源

2016-06-08 05:36:50

相關問題

1. R中的rpart：公式中的變量
2. 執行Android Studio中
3. R rpart創建終端節點表
4. R中並行R執行問題
5. 在R中使用tm和rpart：文本數據的決策樹？
6. 在R Studio中逐行調試
7. 執行，如果對R中
8. 執行列逐列R中
9. 無法從rpart
10. 如何在R中執行rowttest？
11. 如何在R中執行多個wilcox.test？
12. 如何在R中執行wilcox測試？
13. 在R中執行for循環
14. 在R中執行cURL命令
15. 如何在R中執行p.adjust？
16. R中tryCatch在出錯時執行
17. 在pl中執行cp -r sql
18. 如何在windows中執行.r文件
19. 如何在R中執行Hartley測試
20. 在R中執行VIF測試
21. 在Visual Studio可執行文件中執行SQL存儲過程
22. 在Android Studio中不執行Gradle任務
23. 如何在visual studio中執行Xamarin.uwp 2017
24. 在IBM Data Studio中執行LIST HISTORY
25. 從R執行SQL
26. 執行[R腳本
27. Rpart - NA處理
28. 在R Studio中的Rmd代碼塊中運行行
29. 任務在Msbuild中執行得很好，但在Visual Studio中不會執行
30. 如何在rpart中應用權重？