3

data.frame で集計を行うたびに、デフォルトで"by = list(...)"パラメーターを使用します。しかし、stackoverflow や、"formula" パラメータでチルダ (~) が使用されている他の場所で解決策が見られます。「by」パラメーターは、これらの変数の「ピボット」として見られます。

場合によっては、出力がまったく同じになることがあります。例えば:

aggregate(cbind(df$A, df$B, df$C), FUN = sum, by = list("x" = df$D, "y" = df$E))

AND

aggregate(cbind(df$A, df$B, df$C) ~ df$E, FUN = sum)

2つの違いは何ですか?また、いつどちらを使用しますか?

4

2 に答える 2