我現在的目標類組成: 壞:3126好:25038如何平衡1:R中與SMOTE 1
所以我想壞(少數)實例的個數等於很好的例子數(1:1)。 所以不好的需要增加〜8倍(額外的21912 SMOTEd實例),而不是增加大多數(好)。我正在嘗試的代碼不會保持好的數量不變。
代碼我曾嘗試:
實施例1:
library(DMwR)
smoted_data <- SMOTE(targetclass~., data, perc.over=700, perc.under=0, k=5, learner=NULL)
實施例1的輸出: 爲:25008良好:0
實施例2:
smoted_data <- SMOTE(targetclass~., data, perc.over=700, k=5, learner=NULL)
實施例2輸出: 不好:25008好:43764
例3:
smoted_data <- SMOTE(targetclass~., data, perc.over=700, perc.under=100, k=5, learner=NULL)
例3輸出: 壞:25008好:21882