2011-11-24 58 views
0

我有一個分類問題,我想要預測結果,但希望我的分類器在答案中獲得多個「嘗試」(類似於放置雙向投注),而不是單一的分類是正確的還是不正確的,並且對這個最好的過程感到疑惑。例如:給定結果A,B,C和D,我想預測它將是'A或B',或者'A或C','正確'的解決方案(那些)至少包含正確的個人答案)相應地影響學習過程。到目前爲止,我的想法是將數據設置成分組,或多或少地按照上面的方式(A或C)進行分組,並以通常的方式訓練分類器,或者訓練多個分類器以使它們多樣化,並簡單地結合結果,但我想知道是否有更好/不同的方式?我相信這不是一個獨特的問題,但我不確定Google的正確術語。來自預測分類器的多個分類

我不知道這是否是一個相關的問題,但是還有一種方法可以包含在選項'我不知道' - 即。不要做分類?

回答

1

許多分類器可以做你想做的。
樸素貝葉斯可以給你每個標籤的概率,所以你可以採取k最可能的標籤,而不是隻有最可能的標籤和輸出。
邏輯迴歸,支持向量機也可以給你每個標籤的分數,讓你做類似的事情。
另一個訣竅是略微干擾輸入特徵向量並將其饋送給分類器。重複幾次,你不會得到一個輸出標籤,但有幾個。您可以按頻率對它們進行計數和排序,以獲得多個潛在答案。然後,您可以制定一些截止條件,僅挑選這些標籤的一部分並將其返回給用戶。