指定するとprobability=T
(またはが 以外に変更されprobability=TRUE
た場合に混乱しないように)、バーの幅がかなり小さいため、ヒストグラム バーの領域全体が 1 になるようなスケーリングになります。面積がすべて 1 になるように、高さは 1 より大きい必要があります。これにより、密度推定曲線または理論上の密度曲線を重ね合わせたり、他の参照を追加したりすることが容易になります。T
TRUE
一般に、y 軸の目盛りラベルは無視する必要があります (プロットされていない方がよいでしょう)。それらは、プロットの重要な部分から気をそらすだけです。
多くの人は、y 軸の目盛りラベルが各グループ内の観測の割合 (またはパーセンテージ) を表すことを望んでいると考えています (独自のカスタム軸で可能です) が、これはまだ気を散らすものだと思います。ヒストグラムのバー/間隔の数を変更するとどうなるかを考えてみてください。ヒストグラムの全体的な構造は同じままですが (大幅な変更を行わない限り)、y 軸の目盛りラベルが変更されることがあります。かなりの差があるため、無視する (または最初から生成しない) 方がよいでしょう。
パーセンテージ (または比率) が本当に必要だと思うなら、コードは次のように単純です。
x <- rgamma(327, 5, 3)
tmp <- hist(x, yaxt='n',ylab='Percent')
tmp2 <- pretty( tmp$counts/sum(tmp$counts)*100 )
axis(2, at=tmp2*sum(tmp$counts)/100, labels=tmp2)
必要に応じて、関数に簡単にラップできます。