2 つのグループ化変数に従ってデータ フレーム内の 1 つの列を集計し、個々の値をコンマで区切ります。
ここにいくつかのデータがあります:
data <- data.frame(A = c(rep(111, 3), rep(222, 3)), B = rep(1:2, 3), C = c(5:10))
data
# A B C
# 1 111 1 5
# 2 111 2 6
# 3 111 1 7
# 4 222 2 8
# 5 222 1 9
# 6 222 2 10
「A」と「B」はグループ化変数で、「C」はカンマ区切りの文字列に折りたたむ変数ですcharacter
。私が試してみました:
library(plyr)
ddply(data, .(A,B), summarise, test = list(C))
A B test
1 111 1 5, 7
2 111 2 6
3 222 1 9
4 222 2 8, 10
しかし、テスト列をそれに変換しようとするcharacter
と、次のようになります:
ddply(data, .(A,B), summarise, test = as.character(list(C)))
# A B test
# 1 111 1 c(5, 7)
# 2 111 2 6
# 3 222 1 9
# 4 222 2 c(8, 10)
character
形式を維持し、コンマで区切るにはどうすればよいですか? たとえば、行 1 は"5,7"
c(5,7) ではなく、のみにする必要があります。