5

時系列データがあります(ここにdata.frameとして投稿しました):

x <- structure(list(date = structure(c(1264572000, 1266202800, 1277362800, 
1277456400, 1277859600, 1278032400, 1260370800, 1260892800, 1262624400, 
1262707200), class = c("POSIXt", "POSIXct"), tzone = ""), data = c(-0.00183760994446658, 
0.00089738603087497, 0.000423513598318936, 0, -0.00216496690393131, 
-0.00434836817931339, -0.0224199153445617, 0.000583823085470003, 
0.000353088613905206, 0.000470295331234771)), .Names = c("date", 
"data"), row.names = c("1", "2", "3", 
"4", "5", "6", "7", "8", "9", "10"
), class = "data.frame")

これをggplotの棒グラフとしてプロットし、月ごとの合計値(月の名前をテキストとして)を表示するための最良の方法は何ですか?

月フィールドを追加することで、これを手動で行うことができます。

x$month <- format(x$date, format="%B")
ddply(x, .(month), function(x) sum(x[, "data"]))

次に、これを個別にプロットしますが、このアプローチを使用して月が正しく順序付けられていません(順序付けされた係数を作成する必要があると仮定しますか?)。また、ggplotには「より簡単な」方法があると思います。

4

1 に答える 1

12

私は時系列データの専門家ではありませんが、このコードは私のために機能しました:

#The binning by month, saving as a date
x$month <- as.Date(cut(x$date, breaks = "month"))

#Plotting
p <- ggplot(x, aes(month, data))+
     stat_summary(fun.y = sum, geom = "bar")

#My suggestions for display
minmax <- max(abs(x$data))

p + geom_hline(y = 0)+
    scale_x_date(minor = "month")+
    ylim(-minmax, minmax)
    # or more ggplot2 accurately
    #+coord_cartesian(ylim = c(-minmax, minmax))

私の提案では、ゼロを線で強調表示することになり、y軸は0を中心に対称になります。各月のバーが各方向に数週間伸びたため、x軸の副グリッド線を「月」に変更しました。これは、データの集計方法にとって実際には意味がありません。

編集: もちろん、このコードのほとんどは、月ごとの合計を作成するためだけのものでした。日付データが日付形式の場合、日付スケールが軸に自動的に使用されます。主要なxブレークとその形式を変更するには、次のようにします。scale_x_date()

p + scale_x_date(major = "month", format = "%b")
#or
p + scale_x_date(major = "month", format = "%B %Y")

?strftimeフォーマット文字列の意味の詳細については、を参照してください。

于 2010-08-16T22:55:51.820 に答える