4

私は最近、R パッケージのbeanplotと、2 つのサブグループの分布を 1 つのプロット (特別な非対称 beanplot ) にプロットする可能性を見つけました。パッケージの説明は、Journal of Statistical Softwareおよびcran.r-project.orgにあります。

次のCODEを使用して非対称 beanplot を作成しました。

library(psych) 
library(beanplot)

var1 <-c(20,33,NA,39,NA,40,34,33,NA,38,NA,8,7,NA,NA,40,34,24,25,36,40,37,34,NA,35)
var2 <- c(1,0,1,1,1,0,1,0,1,NA,1,0,0,0,0,1,1,0,1,0,1,1,NA,0,1)
mydata<-data.frame(var1,var2) 
table(mydata)

par(lend = 1, mai = c(0.8, 0.8, 0.5, 0.5))
beanplot(var1 ~ var2, data= mydata,  side = "both",log="", 
what=c(1,1,1,0), border = NA, col = list("black", c("grey", "white")))
legend("bottomleft", fill =c("black", "grey"), legend = c("no", "yes"))

生成されたプロットは、2 つのサブグループの分布の異なる形状をうまく示しています。

非対称ビーンプロット

問題

従属変数は、7 から 40 までのスケールで測定されます。ただし、y 軸は -1 から +55 までの範囲にあるように見えます。

スケールがどのように変更されているか、つまり実際にここにプロットされているものを誰かが説明できれば素晴らしいでしょう。元のスケールを使用して分布をプロットする方法はありますか?

大変感謝します!

4

1 に答える 1

4

beanplotを使用しdensityます。推定された密度は、観測されたデータの範囲を超えた領域に質量を与えることができます。これを試して、密度が何をするかを理解することができます-plot(density(1:2))データポイントを中心としたガウス密度の平均をとっていることがわかります(beanplotカーネルパラメーターを指定できるように、別のカーネルを使用できることに注意してください) 。そのガウス分布の分散をどのように選択するかはあなた次第ですが、デフォルトでは、beanplotがbw.SJ「dpi」メソッドを使用して帯域幅を選択しているように見えます。

cutminとcutmaxを使用して、beanplotが実際にプロットする範囲を制御できますが、これによって密度推定が実際に変更されることはありません。

于 2012-11-26T18:20:37.480 に答える