data.table
私はこの方法で切り詰めたい非常に大きなものを持っています:
一意の ID は 1 つだけ
同じログに「X」以外のデータがある場合、それ以外は残す必要があります
X のみの場合、最初の X はそのままにしておく必要があります
「X」以外に複数ある場合は、「X」ではなく、カンマで区切られたままにする必要があります。
サンプル データセット:
library(data.table)
dt <- data.table(
id=c(1,1,2,3,3,4,4,4,5,5),
log=c(11,11,11,12,12,12,12,12,13,13),
art=c("X", "Y", "X", "X", "X", "Z", "X", "Y","X", "X")
)
dt
id log art
1: 1 11 X
2: 1 11 Y
3: 2 11 X
4: 3 12 X
5: 3 12 X
6: 4 12 Z
7: 4 12 X
8: 4 12 Y
9: 5 13 X
10: 5 13 X
必要な出力:
id log art
1 11 Y
2 11 Y
3 12 Z,Y
4 12 Z,Y
5 13 X