いくつかの列でグループ化し、dplyr のいくつかの列を要約すると、奇妙なデータ構造が得られます。データ フレームは大きく、結果のデータ構造の奇妙さはより重大ですが、以下では問題の小さなバージョンを作成します。
すべて順調:
library(dplyr)
df <- data.frame(A = c(1,1,2,2), B = c(1,1,2,2), C = c(10,20,30,40), D = c(1000,2000,3000,4000))
df %>% group_by(A) %>% summarize(C = sum(C),D = sum(D)) %>% str()
Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 2 obs. of 3 variables:
$ A: num 1 2
$ C: num 30 70
$ D: num 3000 7000
これは何ですか?
df %>% group_by(A,B) %>% summarize(C = sum(C),D = sum(D)) %>% str()
Classes ‘grouped_df’, ‘tbl_df’, ‘tbl’ and 'data.frame': 2 obs. of 4 variables:
$ A: num 1 2
$ B: num 1 2
$ C: num 30 70
$ D: num 3000 7000
- attr(*, "vars")=List of 1
..$ : symbol A
- attr(*, "drop")= logi TRUE