2017-02-21 121 views
1

我是一名初學者,學習深度學習與嬰兒的步驟。我有一個關於設計網的問題。我在論文中看到,有不同輸入/輸出的層,我不知道如何在實施之前計算/設計。 例如,在paper中,原理圖層輸出旁邊有一些數字(請參見下圖)。如何爲具有特定圖像大小的網絡指定這些過濾器大小和其他參數作爲輸入。 enter image description here如何設計CNN(圖層的輸入和輸出)?

或者在另一紙,它們具有以下設計: enter image description here

,他們已經提到的那樣,對於一個256x256輸入圖像, 網絡的總子採樣因子是4,導致 一個64x64xL array,其中L是類標籤的數量。如何獲得這個64x64大小?

如何學習設計網絡並計算圖層的輸入/輸出?

謝謝你的任何幫助

回答

2
  1. 如果用stride=2池兩次表示您通過一個因子2的圖像尺寸減小兩次,總的圖像尺寸的X4還原(子採樣)的所得。因此,如果您從大小爲256:256/4 = 64的圖像開始。

  2. 如何選擇內核大小,每層輸出數量,步幅和其他設計參數?其實沒有單一的答案,基本上很多論文/作品都採用不同的設置來處理相同的任務。 AFAIK沒有明確的指導方針或明顯的適合任何特定任務的參數選擇。
    這就是說,你可以找到this work調查一些新興的深網設計模式。

+0

非常感謝Shai,請問表格中第3列的過濾器是如何計算的,您可以看到64,128,256,512,512,1024,39?謝謝 –

+0

@ S.EB你可能會選擇其他的數字。 – Shai

+0

親愛的Sai,非常感謝。我讀了那篇論文。真的很高興獲得良好的信息。感謝分享。 –