5

重複の可能性:
巨大な (3.5 GB) csv ファイルをトリミングして R に読み込む

Rには、メモリに収まらないデータを透過的に処理する良い方法がありますか? ビッグ データを扱うためのパッケージはいくつかありますが、実際のインターフェイスが何であるかを理解せずに 1 つをデプロイする決定を下したくありません。

たとえば、まとめてメモリに収まらないレコードのコレクションがあるとします。ただし、サブセットをロードすると、それは非常に単純なデータ フレームで表され、そのデータに対してあらゆる種類の有用な選択と集計を行うことができます。コレクション全体を単一のデータ フレームとして扱い、透過的に同じ操作を実行できるようなパッケージはありますか?

4

0 に答える 0