2016-08-14 85 views
0

我正在尋找訓練我的支持向量機分類器的C(成本參數)的最佳值。這裏是我的代碼:訓練支持向量機分類器時Wierd behaviors

clear all; close all; clc 

% Load training features and labels 
[y, x] = libsvmread('training_data.train'); %the training dataset is named training_data.train 


cost=[2^-7,2^-5,2^-3,2^-1,2^1,2^3,2^5,2^7,2^9,2^11,2^13,2^15]; 
accuracy=zeros(1,length(cost)); %This array will store the accuracy values corresponding to each element in the cost array 

for i = 1:length(cost) 
    opt = sprintf('-c %i -v 3',cost(i)); 
    accuracy(i)=svmtrain(y,x,opt); 
end 

accuracy 

我正在使用LIBSVM庫。當運行該程序,精度陣列被填充有很奇怪的值: 這裏是輸出:

列1到8:

67.335 93.696 91.404 92.550 93.696 93.553 93.553 93.553

列9通過12:

93.553 93.553 93.553 93.553

這意味着我得到2 ^最高的交叉驗證準確性-5。我應該獲得最高C值的最高精度嗎? (據我瞭解,這是錯誤分類的懲罰因素)。這種行爲是否期望它? (我正在使用UCI ML數據庫構建乳腺癌鑑定分類器)。

回答

1

我應該在C的最高值上獲得最高精度嗎? (據我瞭解,這是錯誤分類的懲罰因素)。

沒有,也不能保證,因爲SVM成本不準確度爲基礎的,它使用一個特定的替代功能,只能大致的行爲像準確性,但你可以期待許多隨機波動。一般來說,你應該期望高C值,但不一定是最高值。

這種行爲應該是它的嗎? (我正在使用UCI ML數據庫構建乳腺癌鑑定分類器)。

是的,這是一個可能的結果。

+0

感謝您的回答。我是Stack Overflow的新手,因此我無法對您的答案讚不絕口。但是它有幫助。 –

+1

@PrashantPandey如果它回答你的問題,你應該*接受*他的回答(儘管有SO分數,這應該總是可能的)。 – sascha

+0

做到了。謝謝你的提示。 –