2017-06-05 186 views
-3

我有一個非常小的數據集(40個訓練樣例,10個驗證示例,120個類),我在Keras(蝙蝠技術,變平和緻密層)中使用非常簡單的模型獲得非常高的精度。驗證準確性總是可以和訓練準確度一樣高嗎?

我的培訓準確率爲94-95%,驗證準確率爲76-78%。我知道這是過度配合,我已經嘗試了一些東西。數據不是圖像,所以我不能增加數據。我也不能添加數據,因爲它是一個特定的類型。我使用了0.5級別的兩個dropout層,並且架構非常簡單,所以我不認爲我可以減少架構的複雜性。如果有人喜歡,我可以粘貼模型。

我的問題是:有沒有驗證準確度不能像培訓準確度那麼高的情況?是否有基於數據集大小的限制?還是總是有可能使驗證準確性與訓練精度相匹配,而網絡只需要正確的參數?

非常感謝你

+2

投票結束,您最好在stats.stackexchange或數據科學網站上提問。要回答你的問題,是的,這是可能的,但極不可能。例如,在您的測試集是您的分類集的完全副本的情況下。更一般地說,如果您確實發現了真正的數據生成過程,那麼您應該獲得「相同」的培訓和驗證準確性。 – Alex

+0

謝謝Alex。我會在那裏發佈。 – Randy

回答

-1

這肯定是過度配合。

過擬合不僅僅是因爲「太強大的模型」,而且還有很多,因爲沒有足夠的數據,我相信這是你的情況。

40個120級示例?這聽起來很像很多數據丟失。

+0

謝謝你的回覆。 – Randy

相關問題