2017-07-22 25 views
0

我有一個數據集,一個類有45個觀察值,另一個類有55個觀察值。此外,我使用4個不同的功能,這些功能以前是通過使用功能選擇過濾器選擇的,雖然此過程的結果有點奇怪。 %到85%),因爲我在Matlab上使用classificationLearner。這將確保沒有過度配合?或者仍然有機會呢?我如何確保沒有過度配合?交叉驗證是否足以確保分類算法中不存在過度擬合?

回答

0

這確實取決於您有可用的訓練數據集。如果您可獲得的數據不夠具有代表性,則無論您使用什麼方法進行培訓和驗證,都無法獲得一個好的模型。考慮到這一點,如果你確定你的數據是有代表性的(對於任何「重要」屬性的任何子集都具有與所有數據的全局集合相同的數值分佈),那麼交叉驗證就足夠依賴於。

+0

非常感謝您的親切幫助! –