2 つの変数に対して 'ddply' を実行するのは、単純なコマンドのように思えますが、ひどい時間を過ごしています。
サンプルデータ (df):
Brand Day Rev RVP
A 1 2535.00 195.00
B 1 1785.45 43.55
C 1 1730.87 32.66
A 2 920.00 230.00
B 2 248.22 48.99
C 3 16466.00 189.00
A 1 2535.00 195.00
B 3 1785.45 43.55
C 3 1730.87 32.66
A 4 920.00 230.00
B 5 248.22 48.99
C 4 16466.00 189.00
私はコマンドを使用しています:
df2<-ddply(df, .(Brand, Day), summarize, Rev=mean(Rev), RVP=sum(RVP))
私のデータフレームには約 2600 の観測値があり、45 レベルの「ブランド」と最大 300 レベルの「日」(「difftime」を使用してコード化) があります。
単純に「日」でグループ化する場合は「ddply」を簡単に使用できますが、「ブランド」でグループ化しようとすると、コンピューターがフリーズします。
考え?