r - RのROSEでのオーバーサンプリングとアンダーサンプリングの問題

翻译自：https://stackoverflow.com/questions/58766934 2019-11-08T12:48:42.817

919 次

勝訴 (14399) と敗訴 (8677) を分類するためのデータセットがあります。データセットには 912 個の予測変数があります。勝ったケースとほぼ同じ数に到達するために、負けたケースをオーバーサンプリングしようとしています (つまり、勝ったケースと負けたケースのそれぞれに 14399 ケースがあります)。

TARGET は、負けた (0) ケースと勝った (1) ケースの列です。

table(dat_train$TARGET)

    0     1 
 8677 14399

今、ROSE ovun.sample を使用してそれらのバランスをとろうとしています

dat_train_bal <- ovun.sample(dat_train$TARGET~., data = dat_train, p=0.5, seed = 1, method = "over")

次のエラーが表示されます。

Error in parse(text = x, keep.source = FALSE) : 
  <text>:1:17538: unexpected symbol
1: PPER_409030143+BP_RESPPER_9639064007+BP_RESPPER_7459058285+BP_RESPPER_9339059882+BP_RESPPER_9339058664+BP_RESPPER_5209073603+BP_RESPPER_5209061378+CRM_CURRPH_Initiation+Quotation+CRM_CURRPH_Ne

誰でも助けることができますか？ありがとう：-）

r - RのROSEでのオーバーサンプリングとアンダーサンプリングの問題

1 に答える 1

Related

Reference