3

boxplotR の関数で深刻な問題が発生しています。箱ひげ図は、グラフの中央線に誤ったラベルを付けています。平均は 7.2376 ですが、箱ひげ図では、下の画像に示すように約 4 で表示されます (次のコードを使用して作成)。

DATA <- c(0.59, 1.00, 1.00, 1.04, 1.22, 1.40, 1.72, 1.74, 1.98, 3.44, 
          3.48, 3.50, 3.53, 3.93, 4.00, 4.33, 4.72, 9.49, 10.80, 11.40,
          12.04, 16.98, 20.43, 27.27, 29.91)

> boxplot(DATA) 
> mean(DATA) = 7.2376

ここに画像の説明を入力

それは私を夢中にさせています。このデータセットでのみそれを行います。他のデータセット、箱ひげ図は平均に問題なくラベルを付けます。

どんな洞察も大歓迎です。

ありがとうございました。

4

2 に答える 2

13

私のコメントは本当に答えになるはずです...

boxplotあなたの混乱は、箱ひげ図が何であるかと同じように、関数ではそれほど多くありません。通常、ボックス プロットには、最小値、第 1 四分位数、中央値、第 3 四分位数、最大値の 5 つの値のみが表示されます。(さらに、ほとんどのプロット アルゴリズムは、何らかの規則に従って「外れ値」を分割します。)

したがって、箱ひげ図の中央の線は、平均ではなく中央値に対応します。

于 2013-04-03T03:00:37.900 に答える