1

つまり、調査対象者が 1 から 7 までの満足度尺度で回答する必要がある満足度調査を実施しました。

これは、データセットからの 2 つの変数間の散布図 (ジッター) がどのように見えるかの例です (私は R に取り組んでいます)。

ここに画像の説明を入力

https://drive.google.com/uc?export=download&id=0Bx2Sns2vaI9ycm1tV2pNSWUxQXc

したがって、私が調べているデータセットは、外れ値分析を実行したい順序データによって形成されています。

このタイプのデータに対する最良の外れ値分析アプローチとして何を提案し、それを R にどのように実装できますか?

よろしくお願いします。

重水素

4

1 に答える 1

1

データは次のようになります。

x = rep(1:7, c(3, 4,17, 21, 48, 118, 93)) 
y = c(
    rep(1:7,c(1,2,0,0,0,0,0)),
    rep(1:7,c(2,0,1,1,0,0,0)),
    rep(1:7,c(10,3,2,1,0,0,1)),
    rep(1:7,c(15,3,1,1,1,0,0)),
    rep(1:7,c(20,10,2,10,3,2,1)),
    rep(1:7,c(40,20,20,30,3,4,1)),
    rep(1:7,c(50,25,10,5,3,0,0))
)

プロット:

library(car)
sp(x,y, jitter = list(x=0.8, y=0.8), smoother=F, reg.line = F)

ここに画像の説明を入力

特定の値がデータの外れ値であるかどうか (つまり、一変量外れ値分析) を知りたいだけの場合は、次を使用できます。

library(outliers)
grubbs.test(x)

boxplotまたは、外れ値としてプロットされた値を単純に使用します。

boxplot(x, plot=F)$out

多変量外れ値が必要な場合は、mvoutlierパッケージを使用できます (関数?chisq.plotと を参照?pcout)。

library(mvoutlier)
pcout(x=data.frame(x,y))
于 2014-03-20T21:26:23.523 に答える