いくつかの疫学的データを分析するために ggplot と R を使用しようとしていますが、流行曲線を適切に表示するのに苦労し続けています。
データはこちら
attach(epicurve)
head(epicurve)
onset age
1 21/12/2012 18
2 14/06/2013 8
3 10/06/2013 64
4 28/05/2013 79
5 14/04/2013 56
6 9/04/2013 66
epicurve$onset <- as.Date(epicurve$onset, format="%d/%m/%Y")
ggplot(epicurve, aes(onset)) + geom_histogram() + scale_x_date(breaks=date_breaks("1 year"), minor_breaks=date_breaks("1 month"), labels = date_format("%b-%Y"))
はこのグラフを与える.これは問題ありませんが、ビン幅はどの期間にも関係がなく、調整には少し試行錯誤が必要です。
この特定のデータセットについて、発症月ごとにケースを表示したいと思います。
これを行う方法を考え出した1つの方法は次のとおりです。
epicurve$monyr <- format(epicurve$onset, "%b-%Y")
epicurve$monyr <- as.factor(epicurve$monyr)
ggplot(epicurve, aes(monyr)) + geom_histogram()
評判システムのため投稿できないグラフを出力します。バーは意味のあるものを表していますが、軸ラベルは爆弾サイトです。scale_x_date
軸は日付ではないため、使用して軸をフォーマットできずscale_x_discrete
、便利なラベルを付けるために渡す引数を特定できません。
オンセット列で操作を行うことで、これを行う簡単な方法があるはずだと感じています。誰か私に指針を教えてもらえますか?