2
我對一個相當小的數據集(即28個obs。的11個變量)執行了100,000個分類樹的隨機森林分析。隨機森林:%IncMSE和%NodePurity之間不匹配
我再發的變量重要性情節
在出現的情節存在的重要變量中的至少一個%IncMSE和IncNodePurity之間的顯失配。事實上,前者的重要性似乎是第七位(即%IncMSE < 0),後者是第三位。
任何人都可以啓發我如何解釋這種不匹配?
所討論的變量與另一個變量顯着相關,這兩個變量在這兩個圖表中一直出現在第二位。這可能是一個線索?