R とデータ サイエンス全般を学び始めています。
データ フレームがあり、ほとんどの変数と予測したいクラスが離散的です。
私がする必要があるのは、このデータの外れ値を見つけて、代入などで対処できるようにすることです。
IQR (Inter Quartile Range) やクック距離、「outliers」パッケージを使用する方法をいくつか調べたのですが、それらのほとんどは連続データにしか適用できないようで、R は適用できないというエラーを出しました。要因、この場合は離散データだと思います。
「outliers」パッケージを使用したときに発生したエラーの 1 つ。
Error in Summary.factor(c(6L, 6L, 8L, 6L, 7L, 7L, 6L, 9L, 12L, 12L, 12L, : 'max' not meaningful for factors
ここで何か間違ったことをしていますか?誰か助けてくれませんか?どんな助けでも大歓迎です、ありがとう。