我正在努力去理解爲了執行OCR而使用NN,我的目標與通常的OCR算法有點不同。使用神經網絡的OCR
我的目標是能夠確定一個特定的輸入是否是特定的字母,例如我期望從用戶那裏得到字母'A',並且我需要確保我沒有得到不同的形狀。
我需要能夠決定給定的輸入是否是正確的形狀。
從我一直在閱讀的內容來看,這裏有幾個選項,MLP,SOM網絡,反向傳播網絡。
據我所知,因爲我打算爲每個形狀(字母)創建樣本以訓練網絡,所以我應該定義一個SOM網絡,這是否正確?
我不確定哪個方向是首選,如果你能指出我的方向是正確的,那就太好了。
我打算使用Encog框架,不知道是否重要。
嘗試caffe https://github.com/BVLC/caffe/tree/master/examples/mnist – 2014-10-08 17:08:23