0

我正在嘗試開發一個使用Matlab作爲我的項目的印地語語言字符識別系統。需要幫助提高模式識別神經網絡的準確性

我的數據集包含大約15000個單字符二進制字形圖像樣本。這些圖像每個都是30 * 30像素。例如附加圖片。該圖像(900個像素值)存儲在X中(使其成爲numOfSamples * 900大小的變量),並且Y是numOfSamples * numberOfClasses大小的矢量,其類別爲1,其餘爲0。

考察,看的鏤空文字圖像:postimg.org/image/lgxh2zq1f/

我使用以下網絡

net=patternnet([500,250,125,65]); 

上述網絡的樣子,

訪問查看網絡:postimg.org/image/666qear15/

我訓練網絡後,

[net,tr]=train(net,X,Y); 

我的ROC繪圖和性能情節看起來像以下,

訪問,查看ROC曲線:https://postimg.org/image/etb5woper/

訪問,查看性能情節:https://postimg.org/image/aij4rmsfd/

現在,在ROC圖中,在0.7左右曲線即使在訓練圖中也會彎曲。我無法理解爲什麼!

我無法獲得所需的準確度。目前的準確率在70%左右,預計在90 +%左右。

我還嘗試過其他模型,如SVM,KNN,Ensemble都給了我大約相同的70%結果。

我對機器學習相當陌生,不勝感激。

謝謝

PS:對不起,不好的鏈接!我是一個新用戶,所以不能發佈超過2個鏈接

回答

0

看看你的ROC曲線,看起來你的分類器表現不佳。一個理想的情況是所有的類都有曲線向左上角延伸。