0

勝訴 (14399) と敗訴 (8677) を分類するためのデータセットがあります。データセットには 912 個の予測変数があります。勝ったケースとほぼ同じ数に到達するために、負けたケースをオーバーサンプリングしようとしています (つまり、勝ったケースと負けたケースのそれぞれに 14399 ケースがあります)。

TARGET は、負けた (0) ケースと勝った (1) ケースの列です。

table(dat_train$TARGET)

    0     1 
 8677 14399 

今、ROSE ovun.sample を使用してそれらのバランスをとろうとしています

dat_train_bal <- ovun.sample(dat_train$TARGET~., data = dat_train, p=0.5, seed = 1, method = "over")

次のエラーが表示されます。

Error in parse(text = x, keep.source = FALSE) : 
  <text>:1:17538: unexpected symbol
1: PPER_409030143+BP_RESPPER_9639064007+BP_RESPPER_7459058285+BP_RESPPER_9339059882+BP_RESPPER_9339058664+BP_RESPPER_5209073603+BP_RESPPER_5209061378+CRM_CURRPH_Initiation+Quotation+CRM_CURRPH_Ne

誰でも助けることができますか?ありがとう :-)

4

1 に答える 1