6

2 つの data.tables があります。別のテーブルのテーブルの組み合わせに一致する行の数をカウントしたいと思います。data.table のドキュメントを確認しましたが、答えが見つかりませんでした。私はdata.table 1.9.2を使用しています。

DT1 <- data.table(a=c(3,2), b=c(8,3))
DT2 <- data.table(w=c(3,3,3,2,3), x=c(8,8,8,3,7), z=c(2,6,7,2,2))
DT1
#    a b
# 1: 3 8
# 2: 2 3

DT2
#    w x z
# 1: 3 8 2
# 2: 3 8 6
# 3: 3 8 7
# 4: 2 3 2
# 5: 3 7 2

ここで、DT2 の (3, 8) ペアと (2, 3) ペアの数を数えたいと思います。

setkey(DT2, w, x)
nrow(DT2[J(3, 8), nomatch=0])
# [1] 3    ## OK !

nrow(DT2[J(2, 3), nomatch=0])
# [1] 1    ## OK !

DT1[,count_combination_in_dt2 := nrow(DT2[J(a, b), nomatch=0])]
DT1
#    a b count_combination_in_dt2
# 1: 3 8                        4 ## not ok.
# 2: 2 3                        4 ## not ok.

期待される結果:

#    a b count_combination_in_dt2
# 1: 3 8                        3 
# 2: 2 3                        1 
4

2 に答える 2

14
setkey(DT2, w, x)

DT2[DT1, .N, by = .EACHI]
#   w x N
#1: 3 8 3
#2: 2 3 1

# In versions <= 1.9.2, use DT2[DT1, .N] instead

上記は単純にマージを実行し、 によって定義された各グループの行数をカウントしi-expressionますby = .EACHI

于 2014-09-16T15:00:51.217 に答える
1

を追加するだけですby=list(a,b)

DT1[,count_combination_in_dt2:=nrow(DT2[J(a,b),nomatch=0]), by=list(a,b)]
DT1
## 
##    a b count_combination_in_dt2
## 1: 3 8                        3
## 2: 2 3                        1

EDIT:いくつかの詳細:元のバージョンでは、DT2[DT1, nomatch=0](すべてのa, b組み合わせを使用したためです。J(a,b)各組み合わせを個別に使用する場合は、引数a, bを使用する必要があります。その後、によってグループ化され、各グループ内で評価されます。bydata.tablea, bnrow(...)

于 2014-09-16T13:24:58.203 に答える