次のようなデータフレームがあります。
date time userid status
1 02/25/2012 09:22:10 aabc logged_in
2 02/25/2012 09:30:10 aabc logged_out
3 02/25/2012 09:29:20 abbc logged_out
4 02/25/2012 09:27:30 abc logged_in
5 02/25/2012 09:26:29 abc login_failed
6 02/25/2012 09:26:39 abc login_failed
7 02/25/2012 09:26:52 abc login_failed
8 02/25/2012 09:27:09 abc login_failed
9 02/25/2012 09:27:20 abc login_failed
10 02/25/2012 09:24:10 abdc logged_in
11 02/25/2012 09:24:12 abdc logged_out
12 02/25/2012 09:22:10 abhc logged_in
13 02/25/2012 09:30:10 abuc logged_in
14 02/25/2012 09:30:14 abuc logged_out
15 02/25/2012 09:29:40 baa logged_in
各ユーザーIDのlogin_failuresのユーザーID、ステータス、および「カウント」が必要です。これは私がしました:
ddply(mytbl, c('userid', 'status'), function(x) c(count=nrow(x)))
、しかし、これはすべてのユーザーIDの数を示します。出力を、ステータスが「login _failed」のユーザー ID のみに制限したいと考えています。何か案は?数値フィールドによるグループ化に関する質問を見たことがありますが、文字列に関する質問はありません。
私はプライアのすべての機能に精通しているわけではありません。要約、集約、sqldf、data.table などを使用してこれを行う方法を確認するのは素晴らしいことです。それぞれをゆっくりと理解してください。
ありがとうスリ