500 万行、3 列の大きなデータ フレームがあります。行としてUSER_ID、列としてID、CNTとして値を持つマトリックスに変換したいと思います。melt
これはand cast
orで行うことができます
xtabs(CNT ~ USER_ID + ID, data = foo)
ただし、作成されたオブジェクトが大きすぎるため、次のエラーが発生します'dim' specifies too large an array
USER_ID ID CNT
1 1.813e+14 21 1
2 1.559e+14 28 1
6 1.592e+14 71 2
data.table を継ぎ目として使用して、data.frame よりもはるかに優れた大きなデータを処理しようとしていますが、data.table を使用して必要な分割表を作成する方法がわかりません。
これを機能させる方法を知っている人はいますか?また、適切な次元で行列を作成して空にし、適切なインデックスで埋めることも考えています。