我在數字識別中遇到問題。在特徵提取部分,我必須使用一些卷積掩模(如link中的圖4.23)來獲取特徵映射和OUTPUT。然而,我不需要什麼樣的面具以及如何獲得面具? (在一些論文中,也許他們使用了後向傳播,但我不知道如何使用它)你能告訴我一些在這部分中使用的口罩,或者如何獲得它們? 非常感謝!任何建議是歡迎!使用卷積神經網絡進行特徵提取?
回答
反向傳播是關於在設置架構之後訓練您的神經網絡。我從來沒有使用神經網絡進行數字識別問題,但這裏有一個關於識別手寫數字的鏈接:link。它有一些代碼示例。
祝你好運。
只是好奇,如果不是神經網絡,你會如何使用OCR? –
在CNN中,您通常會有一個2D圖像作爲輸入數據,比如像MNIST中的黑色&白色28x28x1(水平,垂直,通道)數字。
然後,創建一個2D內核(作爲示例的3×3的內核)上滑動以限定步幅(它移動多少像素(水平)/垂直每個步驟)和填充所述輸入圖像的像素比(多少值爲0的像素添加到所有邊以使滑動核心能夠在到達其邊界時覆蓋圖像的每個像素)。假設使用的Kernel = 3x3,Padding = 1,Stride = 1。
此內核在滑動時應用於卷積,也會生成28x28圖像,其中每個像素是內核與輸入圖像的不同區域的卷積。
如果不是隻有一個內核,您可以創建其中的16個,在卷積之後,您將獲得16個28x28圖像,每個圖像表示圖像的不同「模式」。 「模式」是每個內核中的內容。
通過監督訓練中的反向傳播,CNN將自動學習放入每個內核的值。例如,一個內核可以有格式
這意味着它會檢測水平線。
我認爲內核是你所說的掩碼。
最後,所有16個28x28圖像可以連接在一起形成一些特徵,可以用作完全連接層的輸入來獲得分類輸出。
請注意,這個解釋是相當簡單的,因爲它跳過了一些段落(深卷積,合併等等),但是我希望它能滿足你的疑惑。
- 1. 在特徵提取中實現卷積神經網絡
- 2. 卷積神經網絡 - 如何獲取特徵地圖?
- 3. 用於時間相關特徵的卷積神經網絡
- 4. 神經網絡特徵提取
- 5. 卷積神經網絡
- 6. 運行訓練卷積神經網絡
- 7. 從卷積神經網絡(CNN)中提取特徵,並將此特徵用於其他分類算法
- 8. float16 VS FLOAT32卷積神經網絡
- 9. 這是在普通卷積神經網絡中進行的基本卷積嗎?
- 10. 爲什麼要對卷積神經網絡進行預訓練
- 11. 缺失特徵的神經網絡
- 12. 使用卷積神經網絡進行四邊形/矩形檢測的想法
- 13. 從圖像中提取前景物體以運行卷積神經網絡
- 14. 卷積神經網絡中並行和順序卷積之間的區別
- 15. 使用卷積神經網絡產生音頻
- 16. 使用卷積神經網絡的逐像素分類?
- 17. 如何在新數據上運行卷積神經網絡
- 18. 用於卷積神經網絡的字嵌入
- 19. 用於實現卷積神經網絡的Keras
- 20. 適用於卷積神經網絡的哪種數據
- 21. 爲什麼卷積濾波器在卷積神經網絡中翻轉?
- 22. 訓練卷積神經網絡識別車號牌
- 23. 卷積神經網絡中權重和輸出的值
- 24. 爲卷積神經網絡準備數據集
- 25. 卷積神經網絡不分類測試集keras
- 26. 3D卷積神經網絡輸入形狀
- 27. Haar級聯方法vs卷積神經網絡?
- 28. 卷積神經網絡Conv1d輸入形狀
- 29. 處理圖像將數據輸入到卷積神經網絡
- 30. 爲卷積神經網絡選擇訓練圖像
如果您有答案,請將您的問題標記爲已關閉。 – amrfaissal
sr,但實際上,我仍然感到困惑! –