2014-10-11 76 views
1

我需要能夠確定的形狀被正確或錯誤地繪製,應該如何設置我的神經元輸入到收到我輸入

我有一個形狀,保持形狀和順序採樣數據像素(由像素的顏色表示)

例如,可以看到下采樣圖象和顏色變化

enter image description here

遇到麻煩找出網絡的我需要定義會接受這一點一種用於訓練的輸入。

我應該將採樣圖像轉換爲矩陣並輸入它嗎?假設我的圖像是64x64,我需要64x64輸入神經元(這就是如果我忽略像素的顏色,我認爲)是可行的解決方案?

如果您有任何指導,我可以使用它:)

+0

是的,下采樣是一個傳統的預處理步驟。如果只是數字識別,您甚至可以對像素進行二進制化處理,以使輸入僅爲16x16或64x64二進制特徵。 – greeness 2014-10-11 23:43:18

+0

所以我應該創建64個輸入神經元,並在時間輸入一個像素列?如果我關心顏色,每個像素輸入應該是該像素顏色的強度? – aviran 2014-10-12 07:41:38

+0

如果下采樣後,您有64x64,那麼你有4096神經元的輸入向量(你需要將這些行或列組合成一個1d數組)。如果你想保持顏色的強度,例如R/G/B,那麼你必須使輸入數量增加三倍,因此神經元的數量變爲4096×3。我建議你進一步降低採樣率,16x16應該足夠了,在輸入層只有256個神經元。 – greeness 2014-10-12 09:54:56

回答

3

我給你一個例子如下。 這是一個字母爲c的二進制4x4圖像。您可以連接行或列。如圖所示,按列連接。然後將每個像素映射到輸入神經元(總共16個輸入神經元)。在輸出層,我有26個輸出,字母az

請注意,在圖中,爲了簡單起見,我沒有將層i中的所有節點連接到層i+1,您可能應該將其全部連接起來。

在輸出層,我突出顯示c的節點,以指示對於此培訓實例,c是目標標籤。預期的輸入和輸出向量列在圖的底部。

如果你想保持顏色的強度,例如R/G/B,那麼你必須使輸入數量增加三倍。每個單個像素被三個神經元取代。

希望這有助於更多。爲了進一步閱讀,我強烈建議Andrew Ng在深度學習教程here - UFLDL。這是這種圖像識別問題的藝術狀態。在本教程的練習中,您將接受嚴格的預處理圖像並使用大量工程技巧進行圖像處理,以及端到端的深度學習算法。

enter image description here