0

我的第一個方法是沒有涉及神經網絡。我只是簡單地比較手寫輸入(數字1-3)和模型圖像,通過索引比較兩個圖像的像素,看它們是否保持相同的RGB值。此方法效果很差,只有在手寫數字與基礎圖像具有相同像素的情況下才有效。現在我想實現某種神經網絡,但我有一些問題。手寫體數字神經網絡

所有圖像由所有黑色或白色像素組成,每個圖像爲500x500像素。

我對神經網絡有一個基本的理解,那裏有後向傳播,偏差,權重,隱藏層等等......我明白他們是抽象地做了什麼,但我對如何實現神經網絡感到困惑。計算機可以識別的模式是什麼?

我想指出,我不限制自己的神經網絡,我接受其他解決這個問題,但神經網絡似乎是解決這個的好方法。

+0

沒有答案(因爲問題可能過於寬泛),但NVIDIA正在研究類似的東西(等等)。特別是,https://developer.nvidia.com/cudnn庫基本上附帶一個樣本,該樣本是http://yann.lecun.com/exdb/mnist/ – Marco13

+0

的分類程序。該種類沒有限制NN可以學習的模式。擁有足夠的數據當然很重要。我不會推薦實現你自己的NN實現,而是使用經過充分測試的庫。我們不知道你在用什麼語言,但是其中一個最強大(也是超級強大)的初學者友好的庫是[keras](https://keras.io/)(python),它也有一個很好的開始Marco提到的MNIST問題模板[here](https://github.com/fchollet/keras/blob/master/examples/mnist_cnn.py)。還有其他的MNIST例子。現代研究將教你:使用**卷積網!**。 – sascha

回答

0

在我的情況下,它的工作......修改後。你的神經網絡可能做得不好,因爲你直接將像素的顏色強度作爲特徵向量。這使得它們對移位非常敏感(例如,將圖像移動一個像素將導致完全不同的矢量)。嘗試根據角色的位置和大小規範化圖像。另外想想如果你可以使用圖像中的其他信息來補充特徵向量。 PS。爲什麼不把RGB轉換成簡單的灰度?從視覺上看,你會得到相同的信息,但你得到的訓練功能要少3倍。