我的問題是,我應該先對整個數據集進行特徵選擇selectkbest
sklearn功能,然後partion數據集中到訓練和測試設置或者我應該在訓練和測試datset執行selectkbest
他們已分區之後?在第二個是那裏不同的k-特徵將被選擇用於測試數據集比被用於訓練的可能性?我對機器學習非常陌生,最近剛剛學習了一些關於特徵選擇的知識。在特徵選擇,我應該使用SelectKBest培訓和測試單獨數據集?
我用單變量特徵選擇例如這裏瞭解selectkbest - http://scikit-learn.org/stable/modules/feature_selection.html爲例