観測密度と累積分布関数を組み合わせたプロットを取得したいと思います。
それに関する通常の問題は、2つのスケールが大きくずれていることです。これをどのように修正できますか。つまり、2 つのスケールを使用するか、データ系列の 1 つを再スケーリングします (データの計算と表示を分離したいので、できれば ggplot 内で)。
これまでのコードは次のとおりです。
>dput(tmp)
収量
structure(list(drivenkm = c(8, 11, 21, 4, 594, 179, 19, 7, 10,
36)), .Names = "drivenkm", class = c("data.table", "data.frame"
), row.names = c(NA, -10L), .internal.selfref = <pointer: 0x223cb78>)
それから私はします
p = ggplot(data = tmp, aes(x = drivenkm)) + geom_histogram(aes(y = ..density..), alpha = 0.2, binwidth = 3) + stat_ecdf(aes(x = drivenkm));
print(p)
私が得るものは次のとおりです。
明らかに、スケールははるかに離れています。ヒストグラムと累積分布関数の両方を適切な方法で解釈できるように、これをどのように修正できますか?
ありがとう!