2012-11-20 22 views
0

我想在我的SVM分類中有一個無效類別。例如考慮水果分類,我想要有APPLE,ORANGE,BANANA和'NOT FRUIT'(無效)。我想知道是否最好爲每個類別創建一個二進制SVM分類器(一個用於ORANGE等的APPLE),或者創建一個帶有無效類別的SVM分類器作爲其中一個類,併爲其提供無效訓練數據。SVM和無效類別

爲了更具體一點,我有一個分類器,分類時間序列數據。我需要將一些美聯儲時間序列分類爲無效類別(或基本不包括所需類別)。

回答

1

no_fruit只是另一個類。你需要的是Multiclass classification。 SVM通過超平面分離類,所以你需要另一種算法。現在大多數軟件包都提供了這樣的多類分類,但性能有所不同。

  1. 他們做的每一類分組對抗他人的
  2. 他們做的每一對每個

不管你做什麼首先你有多個結果(剪刀,石頭,布)

  1. 在這種情況下,您可能有0到n的積極因素
  2. 在這種情況下,您可能會有1到n個班級,其中1到n-1票

我會建議使用一個庫來做投票。

雖然你說'時間序列數據'。這聽起來不像水果,並可能有其他要求

1

這取決於您的SVM軟件包。如果你使用的是libsvm,你可以有幾個「積極」的類。只需稱爲「無效」類0,蘋果爲1,橙色爲2,依此類推。

+0

但是,如果我創建多個分類器,它會訓練得更好嗎?蘋果分類器(是,否),橙色(是,否)等 – Ali

+1

這取決於。 SVM嘗試使用超平面將nD(或(n + 1)D空間)中的數據分開。如果你有兩個類別,分隔很簡單:你的空間點落在一邊或平面或另一邊。如果您有多個類別,則正面類別也會被超平面分開,這意味着當模型預測它是蘋果時,不僅意味着它不是「無效」,而且也不是「橙色」。你需要弄清楚,確定一種水果還是無效水果是你想要的,或者確定「蘋果」是蘋果,「橙色」是橙色,而不是無效。 – Bee