在用python編寫的深度學習程序中,我想要一次性在numpy數組中存儲大量圖像數據,並從該數組中隨機提取批量數據,但圖像數據太大,內存耗盡。 我們應該如何處理這種情況?每次檢索批處理數據時,我別無選擇,只能進行IO處理並從存儲中讀取圖像數據?我想讀取大量的圖像進行深度學習,但當內存不足時該如何解決?
1
A
回答
1
文件I/O可以解決這個問題,但會減慢Leanring進程,因爲FILE I/O是一項需要很長時間的任務。
但是,您可以嘗試使用多線程(例如,
https://github.com/stratospark/keras-multiprocess-image-data-generator
(我不知道你用的是什麼樣的架構)。
好歹回到基本思想:
挑選一些隨機的文件以及閱讀它們,開始訓練。在訓練期間開始第二個線程,它將再次讀取隨機文件。因此,您的學習線程無需等待新數據,因爲培訓過程可能比讀取過程花費更長的時間。
一些框架有這個功能已經實現,退房:
https://github.com/fchollet/keras/issues/1627
或:
https://github.com/pytorch/examples/blob/master/mnist_hogwild/train.py
相關問題
- 1. 當讀大文件時內存不足
- 2. 準備jpg圖像數據進行深度學習?
- 3. 我想學習如何組成圖像
- 4. 圖像分類深度學習
- 5. 我該如何解決Magento內存不足致命錯誤?
- 6. 我的顯卡適合用MATLAB進行深度學習嗎?
- 7. 如何解決內存不足問題
- 8. 我該如何解決這個圖像內存泄漏?
- 9. 爲什麼我們需要GPU進行深度學習?
- 10. 使用AMD圖形卡在Matlab上進行深度學習
- 11. 在深度學習中使用AlexNet進行圖像識別的奇怪結果
- 12. 從SD卡讀取圖像時出現內存不足錯誤
- 13. 如何應用UI學習自動化的深度學習?
- 14. 如何解決從drawable設置圖像時出現內存不足錯誤?
- 15. 用於映射大型二進制輸入的深度學習
- 16. 如何培養深度學習網絡
- 17. 學習C#,想了解該代碼
- 18. 在讀取大文件時系統內存不足的問題
- 19. 如何解決大熊貓scikit學習多維尺度始終運行
- 20. 圖像的深度學習必須具有相同的大小嗎?
- 21. 準備輸入到Caffe深度學習的圖像數據集
- 22. 深度學習中的圖像預處理
- 23. 加載大量的圖像導致內存不足
- 24. 當我想從表中讀取特定批量大小時,如何在sql中進行取整
- 25. 我想從頭開始學習wordpress。我如何學習?
- 26. AssertionError當我使用深度學習庫Keras
- 27. UrlEncodedFormEntity與圖像時內存不足
- 28. SOLR內存不足錯誤讀取索引大型索引時
- 29. 當在Android上用Apache poi讀取xls時內存不足
- 30. 如何使用hyperopt進行Keras深度學習網絡的超參數優化?
當內存即將用完時,操作系統會自動開始將數據移動到HDD。這是最糟糕的情況,尤其是您的硬盤緩慢,每個應用程序都會變慢。這也消耗CPU資源。所以至少你必須控制數據量不要達到最大內存大小。 –