2016-05-07 29 views
4

Batch normalization使用小批量平均值和方差來標準化圖層輸出。如果我訓練批量大小的網絡(比如說100),但是希望在單次預測(批次大小1)上使用訓練好的網絡,我是否應該遇到問題? 爲了避免這種情況,我應該懲罰批量規範層以便在學習期間向身份轉換收斂嗎?批量標準是否需要恆定的批量大小?

回答

3

不,這樣做沒有問題,在測試時間批處理規範化層只是縮放和移動輸入,並且在訓練時學習到的因素。

+0

如果我的測試輸入是異常值,是不是中心不正確?將批量規範設置爲使用完整訓練集的均值/覆蓋率是否更好? – Mageek

+0

啊我明白了。您在說我們不會在測試時重新計算最小批處理均值和協方差。這就說得通了。 – Mageek

+0

是的,在測試時沒有什麼東西可以學到。 –