1

R とデータ サイエンス全般を学び始めています。

データ フレームがあり、ほとんどの変数と予測したいクラスが離散的です。

私がする必要があるのは、このデータの外れ値を見つけて、代入などで対処できるようにすることです。

IQR (Inter Quartile Range) やクック距離、「outliers」パッケージを使用する方法をいくつか調べたのですが、それらのほとんどは連続データにしか適用できないようで、R は適用できないというエラーを出しました。要因、この場合は離散データだと思います。

「outliers」パッケージを使用したときに発生したエラーの 1 つ。

Error in Summary.factor(c(6L, 6L, 8L, 6L, 7L, 7L, 6L, 9L, 12L, 12L, 12L,  : 'max' not meaningful for factors

ここで何か間違ったことをしていますか?誰か助けてくれませんか?どんな助けでも大歓迎です、ありがとう。

4

0 に答える 0