4

kde2d (Kernel density estimator).同じ変数空間内の 2 つの異なるデータ セットに対して 2 つの異なる kde2d を計算していることについて質問があります。両方をfilled.contour2またはcontoursと比較すると、散布図の点の密度が低いセット(合計で10倍の点も少ない)は、等高線の値の密度が高いことがわかります。ポイント密度が高いセットほど密度等高線の値が高くなると予想していましたが、上記のようにそうではありません。それは、帯域幅 (h) の選択に関係している必要がありますか? equals h を使用していますが、変更しようとしましたが、結果はあまり変わりませんでした。私のエラーは何ですか?

a <-  runif(1000, 5.0, 7.5)
b <-  runif(1000, 2.0, 3.0)
c <-  runif(100000,5.0, 7.5)
d <-  runif(100000, 2.0, 3.0)
library(MASS)
abdens <- kde2d(a,b,n=100,h=0.5)
cddens <- kde2d(c,d,n=100,h=0.5)
mylevels <- seq(-2.4,30,0.9)
filled.contour2(abdens,xlab="a",ylab="b",xlim=c(5,7.5),ylim=c(2,3), 
                col=hsv(seq(0,1,length=length(mylevels))))
 plot(a,b)
contour(abdens,nlevels=5,add=T,col="blue")
plot(c,d)
contour(cddens,nlevels=5,add=T,col="orange")
4

1 に答える 1