同じデータで、2 つの異なる boxplot メソッドを使用すると、ウィスカーに 2 つの異なる長さが提供されます。ウィスカーは、上限 (下限) フェンス値よりも小さい (大きい) 最大 (最小) ポイントまでしか移動しないことを理解しています。私の場合、彼らは別の最大点を選んでいるか、フェンスの計算が間違っています。私がドキュメントで読んだことから、両方の方法が 1.5 IRQ を使用しており、フェンスの制限は 57.8 である必要があるため、58.8 ではなく 39 を選択する必要があります。
http://docs.ggplot2.org/0.9.3.1/geom_boxplot.html
https://stat.ethz.ch/R-manual/R-devel/library/grDevices/html/boxplot.stats.html
geom_boxplot
df=data.frame(num=c(81.16469 ,11.59219 ,29.7309 ,86.03547 ,16.42667 ,33.52099 ,26.07814 ,30.91522 ,39.49079 ,31.634 ,37.8732 ,20.50268 ,16.9127 ,20.1115 ,23.74309 ,22.30444 ,24.21399 ,27.30867 ,39.07071 ,14.81049 ,21.42116 ,23.30437 ,17.94871 ,17.50281 ,58.82008 ,20.18478 ,10.65572 ,37.97092 ,25.16336 ,35.69668))
quantile(df$num)
0% 25% 50% 75% 100%
10.65572 20.12982 24.68867 35.15276 86.03547
boxplot(df$num)
IQR(df$num)*1.5+quantile(df$num)[4]
75%
57.68716
ggplot(df,aes("x",num))+geom_boxplot()
boxplot(df$num)
df$num
さらに重要なことに、任意の関数を使用して、統計情報 (長さ 5 のベクトル、下のひげの極値、下の「ヒンジ」、中央値、上の「ヒンジ」、および上のひげの極値を含む)を抽出したいと考えています。そのためggplot
、特定の場所にテキストを追加できます。boxplot.stats(df$num)$stats
以下はそれらの統計を提供しますが、上のひげは私のggplot
結果と一致していません.
boxplot.stats(df$num)$stats
[1] 10.65572 20.11150 24.68867 35.69668 58.82008