我正在運行一個模型來檢測圖像中的一些有趣功能。我有一組圖像測量600x200像素。這些圖像具有我想識別的岩石碎片等特徵。設想一個覆蓋在圖像上的(4x12)網格,我可以使用註釋工具(如((4,9), (3,10), (3,11), (3,12))
)手動生成註釋以識別圖像中感興趣的單元格。我可以用Keras構建一個CNN模型,將輸入作爲灰度圖像。但是,我應該如何編碼輸出。這似乎直覺對我的一種方法是把它當作形狀(12,4,1)
的稀疏矩陣,只有有趣的細胞具有1,而其他都爲0我的CNN輸出層應該是什麼樣子?
- 有沒有更好的方式來編碼輸出?
- 最後一層應該是什麼激活功能?我正在使用ReLU作爲隱藏層。
- 損失函數應該是什麼?將
mean_squared_error
工作?
爲什麼不分割你的圖像,並用「小型網絡(4 * 12)」來劃分每個網格區域? –
這些圖像從圓形鑽孔中展平。因此,我對正弦曲線模式感興趣,以識別有趣的地質特徵,而不是其他看起來相似但不是正弦曲線的岩石特徵。 –