data.frame で集計を行うたびに、デフォルトで"by = list(...)"
パラメーターを使用します。しかし、stackoverflow や、"formula" パラメータでチルダ (~) が使用されている他の場所で解決策が見られます。「by」パラメーターは、これらの変数の「ピボット」として見られます。
場合によっては、出力がまったく同じになることがあります。例えば:
aggregate(cbind(df$A, df$B, df$C), FUN = sum, by = list("x" = df$D, "y" = df$E))
AND
aggregate(cbind(df$A, df$B, df$C) ~ df$E, FUN = sum)
2つの違いは何ですか?また、いつどちらを使用しますか?