我正在使用預先訓練的GoogLeNet,然後在我的數據集上對其進行了精細調整,以對11個類進行分類。驗證數據集似乎給出了「loss3/top1」86.5%。但是當我評估我評估數據集的表現時,它給我77%的準確度。無論我做了什麼更改train_val.prototxt,我在deploy.prototxt中做了相同的更改。驗證和評估準確性之間的差異是正常的還是我做錯了什麼? 有什麼建議嗎?驗證和評估準確性的差異
2
A
回答
4
爲了讓您在驗證數據集上獲得您的訓練模型的公平估算,您需要以有意義的方式設置test_itr
和test_batch_size
。
所以,test_itr
應設置爲:
Val_data/test_batch_Size
其中,Val_data
是您的驗證數據集的大小和test_batch_Size
是對的batch_size驗證階段設置驗證批次大小值。
相關問題
- 1. 評估板之間的性能差異
- 2. TFLearn - 用於驗證和評估的度量標準?
- 3. angularjs - 評估驗證指令
- 4. 表單驗證評估
- 5. 損失和驗證損失減小,但準確性和驗證準確性保持靜態
- 6. 評估生成的XML Schema的準確性
- 7. C++'AND'評估 - 標準有保證嗎?
- 8. 什麼時候val值準確評估?
- 9. R包函數中的標準評估與非標準評估
- 10. 如何評估年,月和日的日期差異(紅寶石)?
- 11. outputLink和graphicImage之間的EL上下文路徑評估差異
- 12. 小驗證準確性RESNET 50
- 13. 性能評估期間的異常值
- 14. #評估準確性。 accuracy_score = classifier.evaluate(input_fn = get_test_inputs,步驟= 1) 「精度」]
- 15. Laravel驗證差異更新和保存
- 16. 驗證的準確性總是大於Keras中的訓練準確性
- 17. 驗證準確性總是可以和訓練準確度一樣高嗎?
- 18. 的XPages(日期時間戳)的驗證和評估
- 19. 規則評估系統和「不準確」匹配(ej:x <3000)
- 20. 使用Fortran正確發現標準差和人口差異
- 21. 定義keras的AUC度量標準以支持驗證數據集的評估
- 22. Ant屬性評估不正確?
- 23. Mathematica中的異步評估
- 24. WPF中的確定性和異步字段驗證
- 25. 差異性()和空
- 26. Mono vs .NET中評估差異的可能順序
- 27. 評估安全性?
- 28. 評估「值」屬性
- 29. MySQL校驗和衝突評估
- 30. 使用布爾值來評估表達式的準確性問題
相差〜10%是相當大的。您在驗證集中有多少個樣本,以及評估集中有多少個樣本?這些集合中分發的標籤是否相同? – Shai
@Shai驗證數據集中的樣本總數爲4123,評估中爲4118個。對於每個類,我確定驗證和評估數據集應包含相同數量的圖像。 – fkeufss
這很奇怪。這個差別太大,不能作爲「樣本錯誤」被駁回,但太小,不足以暗示一個主要錯誤... – Shai