2016-05-05 41 views
0

使用隨機森林的scikit。是否有可能強制拆分某個二進制功能。我有一個數據集,其中一個特徵是男人或女人。我發現他們有很大的不同,第一次分裂應該是在性別上。我當然可以製作模型,但是對於一個模型來說這是可行的。強制拆分隨機森林

回答

0

總之,第

然而,你的問題建議你不完全理解一個隨機森林是如何工作的。

我建議閱讀https://citizennet.com/blog/2012/11/10/random-forests-ensembles-and-performance-metrics/

數據劈叉正在做的方式,最大限度方差,劈叉之間。因此,如果您提到的特徵是真實的預測性的,那麼樹在某個點上應該分割該特徵(取決於其他特徵的預測能力)。

此外,sklearn中的所有樹模型都具有導出拆分的功能 - 因此,您可以安裝樹並檢查發生了什麼。

http://scikit-learn.org/stable/modules/generated/sklearn.tree.export_graphviz.html

第9章統計學習(這是適用於作者的網站上免費下載)的要素涵蓋了理論更深入,如果你想知道更多。