勝訴 (14399) と敗訴 (8677) を分類するためのデータセットがあります。データセットには 912 個の予測変数があります。勝ったケースとほぼ同じ数に到達するために、負けたケースをオーバーサンプリングしようとしています (つまり、勝ったケースと負けたケースのそれぞれに 14399 ケースがあります)。
TARGET は、負けた (0) ケースと勝った (1) ケースの列です。
table(dat_train$TARGET)
0 1
8677 14399
今、ROSE ovun.sample を使用してそれらのバランスをとろうとしています
dat_train_bal <- ovun.sample(dat_train$TARGET~., data = dat_train, p=0.5, seed = 1, method = "over")
次のエラーが表示されます。
Error in parse(text = x, keep.source = FALSE) :
<text>:1:17538: unexpected symbol
1: PPER_409030143+BP_RESPPER_9639064007+BP_RESPPER_7459058285+BP_RESPPER_9339059882+BP_RESPPER_9339058664+BP_RESPPER_5209073603+BP_RESPPER_5209061378+CRM_CURRPH_Initiation+Quotation+CRM_CURRPH_Ne
誰でも助けることができますか?ありがとう :-)