我對在測試數據集中使用cross cross_val_predict感到困惑。對測試數據集使用cross_val_predict
我創建了一個簡單的隨機森林模型,並用於cross_val_predict作出預測
from sklearn.ensemble import RandomForestClassifier
from sklearn.cross_validation import cross_val_predict, KFold
lr = RandomForestClassifier(random_state=1, class_weight="balanced", n_estimators=25, max_depth=6)
kf = KFold(train_df.shape[0], random_state=1)
predictions = cross_val_predict(lr,train_df[features_columns], train_df["target"], cv=kf)
predictions = pd.Series(predictions)
我在這裏的下一步困惑,如何使用上面學會了對測試數據的預測設定?
你必須首先「模擬」你的模型,然後你可以調用它的「預測」。 –