2
有沒有辦法在隨機森林中引入「未知」類別或進行二元分類?R中隨機森林中的二元分類或未知類別
我想將數據輸入到一個隨機森林中,如果選票的百分比超過70%,我只想對其進行分類。我共有6個類別,所以我最初做的是創建一個隨機森林,並且截止值自動默認爲c(16.6, 16.6, 16.6, 16.6, 16.6, 16.6)
。這是相當低的,所以我想要:
- 爲每個類別(總共6)使用二進制分類(或者它屬於該類別或它不 - 它的未知),然後將未知數據饋入下一個樹中,依此類推。
- 或者,我希望能夠堅持一個隨機森林,但是要引入新的截止值,這允許我指定「獲勝」類必須擁有大於70%的選票比例,並且任何未標記爲「未知」的數據。
第二種方式目前提出了一個問題,因爲切斷值需要和爲1,第一個建議是,我似乎無法找出如何做二元分類中R.
問題無論如何,其中任何一個都可以克服,並且引入一個「未知」類別?謝謝