3 つの変数の 167 個の観測値のデータ セットがあります。堅牢なマハラノビス距離を使用して、多変量の外れ値を評価して削除しようとしています。これを行うために、パッケージのMoutlier
関数をいじっています。chemometrics
私はRにかなり慣れていないので、いくつか質問があります:
これが私のコードです:
data<-isotopes
x=data[,c(3:5)] #columns 3-5 contain the data I need to assess
require(robustbase)
res <- Moutlier(data[,c(3:5)] ,quantile=0.975,plot=TRUE)
res
which(res$rd>res$cutoff)
1) 誰かが以前にこのコードを使用したことがありますか?私はこれを正しく行いましたか?
2) この関数を実行する前にデータを標準化する必要がありますか?それとも問題ではありませんか?
3)which
関数を使用した後の結果は次のとおりです。
# [1] 13 28 29 47 79 84 89 91 104 128 153 154
これは、これらの数値が観測番号 13、28、29 などに対応することを意味しますか?
では、これらは 3 つの変数すべてについて、削除したい外れ値でしょうか?
どなたかお力添えいただける方、よろしくお願いいたします。...