我準備在凱拉斯學習相當大的神經網絡(fc,conv,pool等)和數以百萬計的小圖片(~~ 100x100像素,每個3個通道)。所有文件將在~~ 800 GB左右,這是我的問題。我應該如何準備數據?如何管理大型神經網絡的數據批次?
我知道Keras可以批量處理,但是學習網絡時最好使用每個8 GB的文件或創建〜300k文件(在每個合併的32或64圖像中)?我認爲擁有更大的文件會更好,讀取8次(8個大文件)的速度比30萬次更快,但我不確定。
我有小於100 GB的內存,所以我不能一次加載整個數據。
謝謝!