df
「メッセージ」を含むデータ フレームがあります。各行はメッセージです。各メッセージには、df$messagedate
POSIXct 形式で呼び出されるタイムスタンプがあります%Y-%m-%d %H:%M:%S
。例:
> head(df)
messageid user.id message.date
123 999 2011-07-17 17:54:27
456 888 2011-07-19 16:56:50
(これは上記のdput()
'ed バージョンです):
df <- structure(list(messageid = c(123L, 456L), user.id = c(999L, 888L),
message.date = structure(c(1310950467, 1311119810), class = c("POSIXct",
"POSIXt"), tzone = "")), .Names = c("messageid", "user.id",
"message.date"), row.names = c(NA, -2L), class = "data.frame")
1 日あたりの合計メッセージ数でデータ フレームを作成するにはどうすればよいですか? 例:
day message.count
2011-07-17 1
2011-07-18 0
2011-07-19 1
メッセージのない日付を含めないのではなく、それらの日付の がmessage.count
ゼロに設定されていることを確認したいと思います。
私がこれまでに行ったこと: の暦日の部分を次のように抽出しましたmessage.date
:
df$calendar.day<-as.POSIXct(strptime(substr(df$message.date,1,10),"%Y-%m-%d",tz="CST6CDT"))
> head(df$calendar.day)
[1] "2011-07-17 CDT" "2011-07-18 CDT" "2011-07-19 CDT"
そこから、日付範囲内のすべてのカレンダー日付のリストを生成できます: daterange <- seq(min(df$calendar.day), max(df$calendar.day), by="day")