2016-12-13 70 views
0

我只是在不平衡數據集上運行隨機森林模型。我得到了一套AUC和混淆矩陣。 AUC似乎並不差,但實際上該模型預測每個實例都是積極的。那麼它是如何發生的以及如何正確使用AUC?在這種情況下如何解釋AUC評分?

enter image description here

ROC曲線如下:

enter image description here

+0

交叉發表:https://stackoverflow.com/q/41132399/781723,https://datascience.stackexchange.com/q/15725/8560。請[不要在多個網站上發佈相同的問題](https://meta.stackexchange.com/q/64068)。每個社區都應該誠實地回答問題,不要浪費任何人的時間。 –

回答

0

當你的數據在一個方向或其他(有點類似小假陽性率偏斜可以有這樣的問題對於罕見病的醫學檢測來說很糟糕)。查看整個受試者工作特徵曲線(ROC曲線)而不僅僅是AUC總結評分可能會有幫助。

+0

您的意思是「歪斜」的數據不平衡? – LUSAQX

+0

不完全。我故意使用了一個模糊的措詞,因爲(a)我不是這方面的專家,我只知道有足夠的危險,(b)很難評論我沒有看到的數據。如果您可以繪製ROC曲線圖併發布,我(或其他人)可能可以幫助解釋問題。 –