2017-09-16 79 views
0

我試圖繪製使用rpart包,其輸出中真的很困惑決策樹一個不尋常的決定樹輸出(多類)。值得注意的是,在第三節點,農業和採礦班怎麼能從城市生產?如何解釋使用軟件rpart

我覺得應該是農業和城市,而不是農業和採礦業。 這裏是我的代碼

df<-read.csv("https://raw.githubusercontent.com/tuyenhavan/Statistics/Dataset/Landsat_Data.csv") 

library(rpart) 

library(rpart.plot) 
set.seed(123) 

dt<-rpart(Land_cover~., data=df) 

rpart.plot(dt,cex=0.35) 

請幫我解釋一下。謝謝

回答

0

節點顯示所有響應類別的相對頻率與多數表決沿,即最常見的類別。如果有聯繫,那些最常見的類別中的第一個顯示爲多數票(當然,這有點隨心所欲)。

因此,在根節點的所有類別的20%的相等頻率和「農業」發生被顯示爲多數表決,因爲它是按字典順序第一類。

類似地,在節點3(用於頻帶1> = 0.03599656) 「城市」 和 「水」 仍然並列爲最頻繁的類別(200個觀測= 24.969%)。因此「城市」被列爲多數票。