2017-03-04 50 views
-1

在我的數據集中,我有300k行,我做了70/30分割,結果似乎是一個好的模型,直到我查看真正的,假的 - 否定的,積極和真實的負面數字。爲什麼我有這麼幾個分類標籤

TP是20,FN是2 FP是3和TN是41.

這是極低的?所以結果很好,但如果模型只能分類的話,90,000是無用的。

我該怎麼做才能改善這一點?兩類Boosted決策樹或神經網絡不會改變那麼多結果。任何建議?

+0

這是一個二元分類嗎?你可以在這裏分享實驗鏈接嗎? –

回答

0

你能否檢查一下你的數據集中是否有缺失值?