交叉驗證是否足以確保分類算法中不存在過度擬合？

我有一個數據集，一個類有45個觀察值，另一個類有55個觀察值。此外，我使用4個不同的功能，這些功能以前是通過使用功能選擇過濾器選擇的，雖然此過程的結果有點奇怪。％到85％），因爲我在Matlab上使用classificationLearner。這將確保沒有過度配合？或者仍然有機會呢？我如何確保沒有過度配合？交叉驗證是否足以確保分類算法中不存在過度擬合？

來源

2017-07-22 D Desira

這確實取決於您有可用的訓練數據集。如果您可獲得的數據不夠具有代表性，則無論您使用什麼方法進行培訓和驗證，都無法獲得一個好的模型。考慮到這一點，如果你確定你的數據是有代表性的（對於任何「重要」屬性的任何子集都具有與所有數據的全局集合相同的數值分佈），那麼交叉驗證就足夠依賴於。

來源

2017-07-22 14:32:44

非常感謝您的親切幫助！ –

交叉驗證是否足以確保分類算法中不存在過度擬合？

回答

相關問題