1
我有一個數據框,其中有一列給出了聚類,我想在每個聚類中執行一個kfold,並在列中測試相同的分數。我們如何在一個列的每個值內對一個熊貓數據框進行二次採樣
我知道我可以用下面的代碼做我自己:
nb_fold = 10
for i in range(nb_fold):
X_train= X.groupby('Cluster').apply(lambda x: x.sample(frac = 1/nb_fold))
X_train.index = temp.index.droplevel(0)
Y_train = Y.loc[X_train.index]
X_eval, Y_eval = X.drop(X_train.index), Y.drop(Y_train.index)
但我想知道是否有一個scikit學習包裝器,由於這確實一個平局與更換,我可以用一個平局,無需更換。
這正是我所需要的,非常感謝! – ysearka