次の(簡略化された)データセットがあります。
df <- data.frame(a=c("A","A","B","B","B"),x=c(1,2,3,3,4))
df
a x
1 A 1
2 A 2
3 B 3
4 B 3
5 B 4
私は大規模なデータセットを扱っているので、data.table パッケージを使用します。
これらの行を df で取得する方法はありますか。ここで、x は a によって最小にグループ化されています。この場合、1、3、4 行目を選択します。
何かのようなもの
df[,min(x),by=a]
しかし、それは私が欲しい行を私に与えません.aでグループ化されたxの最小値を表示するだけです.
助言がありますか?