大きなデータ フレームを扱っていて、RAM の制限に達しました。この時点で、おそらくディスク上のシリアル化されたバージョンで作業する必要があります。メモリ不足操作をサポートするパッケージがいくつかありますが、どれが私のニーズに合っているかわかりません。すべてをデータ フレームに保持したいので、ff
パッケージは有望に見えますが、回避できない互換性の問題がまだ残っています。
データがメモリ不足の規模に達したことに気付いたときに、最初に使用するツールは何ですか?
大きなデータ フレームを扱っていて、RAM の制限に達しました。この時点で、おそらくディスク上のシリアル化されたバージョンで作業する必要があります。メモリ不足操作をサポートするパッケージがいくつかありますが、どれが私のニーズに合っているかわかりません。すべてをデータ フレームに保持したいので、ff
パッケージは有望に見えますが、回避できない互換性の問題がまだ残っています。
データがメモリ不足の規模に達したことに気付いたときに、最初に使用するツールは何ですか?
あなたはおそらくこれらのパッケージを見たいと思うでしょう:
lm()
とスタイルのモデルに適合するメモリ不足モデルのbiglmglm()
。また、ハイパフォーマンス コンピューティングタスク ビューも参照してください。
disk.frameは、これらのタイプのタスクに適していると言えます。私はパッケージの主な作成者です。
簡単に処理できるデータ型を制限するff
およびとは異なり、 を「模倣」して、データを操作するための動詞を提供しようとします。bigmemory
data.frame
dplyr