我正在試驗R和randomForest包,我有一些SVM和神經網絡的經驗。 我的第一個測試是嘗試並回歸:sin(x)+高斯噪聲。 使用神經網絡和svm,我獲得了sin(x)的一個「相對」很好的近似值,所以噪聲被濾除,學習算法不會過度擬合。 (爲體面的參數) 當在randomForest上做同樣的事情時,我有一個完全過度的解決方案。 我只是使用(R 2.14.0,試圖在2.14.1過,以防萬一):RandomResorest R中的迴歸
library("randomForest")
x<-seq(-3.14,3.14,by=0.00628)
noise<-rnorm(1001)
y<-sin(x)+noise/4
mat<-matrix(c(x,y),ncol=2,dimnames=list(NULL,c("X","Y")))
plot(x,predict(randomForest(Y~.,data=mat),mat),col="green")
points(x,y)
我想有一個隨機森林魔法選項,使其正常工作,我嘗試了一些,但我沒有找到正確的拉桿...
這是我嘗試的選項之一,它給出了稍微好一點的結果,但它仍然看起來非常糟糕,與svm和nn相比...必須有更好的選項... – user1206729 2012-02-14 13:42:34
有趣的事情之一機器學習是沒有一種萬能的方法。某些類型的算法適用於不同類型的數據。不幸的是,我還沒有找到一個資料來源概述哪種方法最適合哪些數據集,因此幾乎完全依賴於試驗和錯誤。 – screechOwl 2012-04-25 15:45:48