2

さまざまな関数といくつかの異なる引数を試しましたが、ヒストグラム

hist(estimator, probability=T, br=5)

どのプロット関数または引数を選択しても、y 軸に密度が表示されません。ベクトル「estimator」には、0.4 から 0.6 の間の約 100 個の値が含まれています。

正確には: hist オブジェクトを作成し、密度を計算して変更し、plot() で再度プロットする方法は機能しますが、最初に hist オブジェクトをプロットしたくありません:/ プロット

4

1 に答える 1

8

指定するとprobability=T(またはが 以外に変更されprobability=TRUEた場合に混乱しないように)、バーの幅がかなり小さいため、ヒストグラム バーの領域全体が 1 になるようなスケーリングになります。面積がすべて 1 になるように、高さは 1 より大きい必要があります。これにより、密度推定曲線または理論上の密度曲線を重ね合わせたり、他の参照を追加したりすることが容易になります。TTRUE

一般に、y 軸の目盛りラベルは無視する必要があります (プロットされていない方がよいでしょう)。それらは、プロットの重要な部分から気をそらすだけです。

多くの人は、y 軸の目盛りラベルが各グループ内の観測の割合 (またはパーセンテージ) を表すことを望んでいると考えています (独自のカスタム軸で可能です) が、これはまだ気を散らすものだと思います。ヒストグラムのバー/間隔の数を変更するとどうなるかを考えてみてください。ヒストグラムの全体的な構造は同じままですが (大幅な変更を行わない限り)、y 軸の目盛りラベルが変更されることがあります。かなりの差があるため、無視する (または最初から生成しない) 方がよいでしょう。

パーセンテージ (または比率) が本当に必要だと思うなら、コードは次のように単純です。

x <- rgamma(327, 5, 3)

tmp <- hist(x, yaxt='n',ylab='Percent')
tmp2 <- pretty( tmp$counts/sum(tmp$counts)*100 )
axis(2, at=tmp2*sum(tmp$counts)/100, labels=tmp2)

必要に応じて、関数に簡単にラップできます。

于 2012-11-28T22:53:25.367 に答える