-2

我有一個圖像集,包含300個圖像對,即原始圖像和蒙版圖像。典型的蒙版圖像如下所示。每張圖片的大小爲800 * 800。我試圖爲這個圖像集訓練完全卷積神經網絡模型來執行語義分割。我試圖從原始圖像中生成小塊(256 * 256)來構造訓練集。是否有任何針對此修補程序採樣過程推薦的策略?當然,隨機抽樣是一個簡單的方法。在此,標有黃色前景類別的區域通常佔整個圖像區域整個圖像區域的25%。它傾向於反映不平衡的數據集。用於訓練完全卷積神經網絡的子補丁生成機制

image example

+0

爲什麼要打補丁?爲什麼不用整個圖像和丟失的樣本像素? – Shai

+0

只有300個圖像對,代表訓練FCN的數據集太小。 – user288609

回答

1

如果訓練完全卷積架構,假設800x800輸入和25x25輸出(經過五2x2池層,25=800/2^5)。嘗試直接構建25x25輸出並直接在它們上訓練。您可以在「正面」標籤的損失函數中添加更高的權重,以使它們與「負面」標籤平衡。

我絕對不建議採樣,因爲這將是一個昂貴的過程,並不是真正的完全卷積。

+0

嗨MZhm,你是什麼意思直接在25 * 25輸出培訓?如果我們不使用抽樣過程,那麼我們只有300個圖像對,是一個訓練深度學習模型的數據集太小了嗎?此外,對於基於FCN的語義分割,輸出應該與輸入大小相同。 – user288609

+0

對於向上採樣回原始圖像大小,我建議您閱讀關於'tf.nn.conv2d_transpose'。對於抽樣來說,在完整圖像上進行訓練是沒有好處的。 (請記住,輸出不是單個預測,它是上面示例中的25x25預測的空間網格) – MZHm

+0

至於300是否足夠的問題......只有一種方法可以檢查 - 訓練和測試它 – MZHm