4

R では、outlier=FALSE パラメーターを使用して、特定のセットのボックスとウィスカーをプロットするときに外れ値を除外しました。それは見事に機能しましたが、どの要素が外れ値であるかをどのように正確に判断するのか疑問に思っています.

boxplot(x, horizontal = TRUE, axes = FALSE, outline = FALSE)
4

3 に答える 3

1

これは確かに からすぐには明らかではありませんboxplot()。パラメータを見てrangeください:

これにより、プロットのひげがボックスからどれだけ伸びるかが決まります。'range' が正の場合、ウィスカーはボックスからの四分位範囲の 'range' 倍以下の最も極端なデータ ポイントまで伸びます。値が 0 の場合、ひげはデータの極値まで伸びます。

したがって、 の値はrange、四分位範囲とボックス (四分位数によって指定される) と共に使用され、ひげがどこで終了するかを決定します。そして、ひげの外側はすべて外れ値です。

この定義が直感的でないことに同意するのは私が初めてです。悲しいことに、それは今では確立されています。

于 2013-02-07T20:23:02.807 に答える