2013-05-07 288 views
0

我使用Weka在已知二元結果的情況下使用訓練數據執行邏輯迴歸。它表現相當好,正確地將大約80%的實例歸類。我還有一個使用當前數據的數據集,其結果是未知的。當我使用當前數據和輸出預測運行模型時,它會將每個實例分類爲Yes或No,並提供錯誤和概率分佈項(其中錯誤+概率分佈= 1)。我無法理解這些結果。有人可以幫我解釋我應該如何解讀它們嗎?我注意到,當概率分佈低於0.5時,模型只猜測是。這是否意味着我應該把它看作是一個概率分佈,結果是肯定的?Weka - 邏輯迴歸 - 解釋結果

回答

1

類probabilites總是要總結爲1。如果你有P(是)= 40%和P(否)= 20%和沒有是唯一的類,你會丟失40%是?如果結果表明P(是)= 60%和P(否)= 40%,並且您要預測,而不是概率,那麼明顯的理性選擇是是的,因爲它具有所有選項的最高概率。這是Bayes optimal decision rule。 (感謝larsmans

在二元分類問題中,這與選擇P> 50%的答案相同。

不知道那是什麼讓你看起來像實際的輸出,它確實好像你得到的概率爲P(否)

+1

+1。 FWIW,選擇具有最高概率(或在二進制情況下> 1/2)的類被稱爲[貝葉斯最優決策規則](http://www.commsp.ee.ic.ac.uk/~vb198/compilation/node3的.html)。 – 2013-05-08 10:26:21

+0

@larsmans Thx的鏈接,我已經包括它:) – Sentry 2013-05-08 10:31:50

+0

謝謝你的澄清。非常感激。 – zgall1 2013-05-08 16:01:09