毎日何度も発生する 4 つの異なるイベント タイプ (A、B、C、D) を含むデータセットがあります。私はそのようなログを1年以上持っています。「EventType」属性は「要因」です。
たとえば、私のデータセットは次のようになります。
DateTime,EventType
6/5/2013 9:35,B
6/5/2013 9:35,A
6/5/2013 9:35,B
6/5/2013 9:36,D
6/5/2013 9:39,A
6/5/2013 9:40,B
7/5/2013 9:35,B
7/5/2013 9:35,A
7/5/2013 9:35,B
7/5/2013 9:36,D
7/5/2013 9:39,A
7/5/2013 9:40,B
8/5/2013 9:35,A
8/5/2013 9:35,A
8/5/2013 9:35,B
8/5/2013 9:36,B
8/5/2013 9:39,A
8/5/2013 9:40,B
9/5/2013 9:35,B
9/5/2013 9:35,B
9/5/2013 9:35,B
9/5/2013 9:36,D
9/5/2013 9:39,A
9/5/2013 9:40,A
すべてのイベント タイプの合計数を毎日プロットしたいと考えています。X 軸: 日時、Y 軸: カウント。
これを達成するために ddply を試すのが好きですが、どうすればよいかよくわかりません。これは私がやったことです:
data <- read.csv("C:/analytics/mydata.csv", sep=",", header=TRUE)
k <- ddply(data, "data$DateTime", function(x) count = nrow(x))
上記により、次の出力が得られます。
data$DateTime V1
1 6/5/2013 9:35,A 1
2 6/5/2013 9:35,B 2
3 6/5/2013 9:36,D 1
4 6/5/2013 9:39,A 1
5 6/5/2013 9:40,B 1
6 7/5/2013 9:35,A 1
7 7/5/2013 9:35,B 2
8 7/5/2013 9:36,D 1
9 7/5/2013 9:39,A 1
10 7/5/2013 9:40,B 1
11 8/5/2013 9:35,A 2
12 8/5/2013 9:35,B 1
13 8/5/2013 9:36,B 1
14 8/5/2013 9:39,A 1
15 8/5/2013 9:40,B 1
16 9/5/2013 9:35,B 3
17 9/5/2013 9:36,D 1
18 9/5/2013 9:39,A 1
19 9/5/2013 9:40,A 1
私の質問: 日別または月別のカウントを取得したい場合、どうすれば同じ動作を実現できますか? lubridate を使用して日または月を取得したいのですが、その後、それを使用してグループ化し、その後カウントを取得する方法がわかりません。
何かのようなものk <- ddply(data, "day(data$EventType)", function(x) count = nrow(x))
それができたら、うまくプロットできると信じています。ご意見をお待ちしております。
ありがとう。