4

我目前通過研究像MNIST示例這樣的示例來了解卷積神經網絡。在神經網絡的訓練,我經常看到這樣的輸出:什麼是神經網絡中的列車損失,有效損失和列車/ Val平均值

Epoch | Train loss | Valid loss | Train/Val 
--------|--------------|--------------|--------------- 
    50 | 0.004756 | 0.007043 |  0.675330 
    100 | 0.004440 | 0.005321 |  0.834432 
    250 | 0.003974 | 0.003928 |  1.011598 
    500 | 0.002574 | 0.002347 |  1.096366 
    1000 | 0.001861 | 0.001613 |  1.153796 
    1500 | 0.001558 | 0.001372 |  1.135849 
    2000 | 0.001409 | 0.0|  1.144821 
    2500 | 0.001295 | 0.001146 |  1.130188 
    3000 | 0.001195 | 0.001087 |  1.099271 

除了時代,有人可以給我究竟每一列代表和什麼值的含義的解釋?我看到很多關於cnn的基本教程,但我沒有遇到過詳細解釋這個的教程。

回答

6

除了用於訓練網絡的數據之外,似乎還使用了一組保留的數據。訓練損失是訓練集數據上的錯誤。驗證丟失是在通過訓練網絡運行驗證數據集後發生的錯誤。培訓/有效是兩者之間的比例。

意外的是,隨着時代的增加驗證和訓練誤差的下降。但是,在某一點上,儘管訓練錯誤持續下降(網絡更好更好地學習數據),但驗證錯誤開始上升 - 這是overfitting

相關問題