年齢の日数のリストがあり、密度プロットに年数で表示したいと考えています。
私はこれを2つの方法で行いました。x軸のラベルを年に変更し、データを365で除算することです。これらの方法では、異なる密度推定値が得られます。
df <- data.frame(id = 1:80000, age = rnorm(80000, 46, 5) * 365)
最初のプロットは、以下を使用して生成されます。
breaks <- seq(from = min(df$age), to = max(df$age), by = 10*365)
ggplot(data = df, aes(x = age)) +
geom_density(aes(y = ..density..)) +
scale_x_continuous(breaks= breaks, labels = floor(breaks/365))
y軸に表示される密度の範囲は0〜0.0002です。
ただし、これを行う場合(上記のようにxラベルを変更するだけでなく、年齢を365で割って年を取得します):
ggplot(data = df, aes(x = age/365)) +
geom_density(aes(y = ..density..))
プロットは同じように見えますが、密度の範囲は0〜0.08です。何が起こっているのか理解するのに苦労しています。2つのプロット間で密度が異なるのはなぜですか。