非常に単純な形式のデータ フレームがあります。
X Y
---
A 1
A 2
B 3
C 1
C 3
私の最終結果は次のようなリストになるはずです:
$`A`
[1] 1 2
$`B`
[1] 3
$`C`
[1] 1 3
この操作では、R で split() 関数を使用しています。
k <- split(Y, X)
これはうまく機能しています。ただし、X の 1,000 万のグループと Y の 387,000 の値を含む 2,200 万行を含むデータ フレームにこのコードを適用すると、非常に時間がかかります。MKL対応のRRO 8.0オープン版を使ってみました。ただし、使用されるカーネルは 1 つだけです。CPU には 64 GB の RAM が搭載されているため、問題になることはありません。
これを計算するためのよりスマートな方法についてのアイデアはありますか?