unique
キー付きで呼び出すと、data.table
各グループごとに一意の行が表示されます。行が重複している場合は、最初の行が取得されます。代わりに最後を取得する必要がある場合(一般的には最後の一時的なトランザクション)、使用します.SD[.N]
library(data.table)
library(microbenchmark)
dt <- data.table(id=sample(letters, 10000, T), var=rnorm(10000), key="id")
microbenchmark(unique(dt), dt[, .SD[.N], by=id])
Unit: microseconds
expr min lq median uq max neval
unique(dt) 570.882 586.1155 595.8975 608.406 3209.122 100
dt[, .SD[.N], by = id] 6532.739 6637.7745 6694.3820 6776.968 208264.433 100
同じことをするより速い方法を知っていますか?