這是在ai.stackexchange中詢問的question的轉貼。由於該論壇沒有太多的牽引力,我想我可能會在這裏嘗試我的機會。深度學習:數據集包含不同尺寸和方向的圖像
我有一個特定對象的不同維度的圖像的數據集。該物體的幾張圖像也處於不同的方向。目標是學習對象的功能(使用自動編碼器)。
是否有可能創建一個網絡,該網絡可以考慮輸入圖像的不同尺寸和方向,或者我應該嚴格考慮包含均勻尺寸圖像的數據集?一般而言,用於培訓深度網絡的合格數據集的必要標準是什麼?
這個想法是,我想避免預處理我的數據集,通過縮放規範化,重新定向操作等。我希望我的網絡能夠解釋尺寸和方向的變化。請同樣指出我的資源。
編輯:
作爲一個示例,考慮由香蕉的圖像的數據集。它們具有不同的尺寸,例如,265x525
px,1200x1200
px,165x520
px等等。90%的圖像以一個正交方向顯示香蕉(例如,正視圖),其餘的以不同的方向顯示香蕉(例如,等距視圖)。
據我所知,沒有超參數可以在訓練過程中根據輸入維度控制cnn模型的結構。 – Dale
@Jugesh:你能否把第一段寫在評論中? –