25 列と最大 1M 行で構成されたデータフレームがあり、12 個のファイルに分割されています。これらをインポートしてから、reshape
パッケージを使用してデータ管理を行う必要があります。各ファイルが大きすぎるため、インポートとデータ処理のために「非 RAM」ソリューションを探す必要があります。現在、回帰を行う必要はありません。データフレームのみに関する記述統計がいくつかあります。
少し検索したところ、2 つのパッケージが見つかりff
ました。最初にマニュアルfilehash
を読んだfilehash
ところ、データフレームをファイルにインポートするためのコードをいくつか追加しただけで、残りは通常の R 操作と似ているようです。
さまざまなクラスが付属しているため、まだ試していませんが、実際の作業を開始する前に、それ自体ff
を理解するために時間を費やす価値があるかどうか疑問に思っています. ff
しかし、filehash
パッケージはしばらくの間静的であるように思われ、このパッケージについての議論はほとんどありませんfilehash
。
使用するパッケージを選択するのを手伝ってくれる人はいますか? または、それらの違い/長所と短所は何ですか? ありがとう。
更新 01
私は現在filehash
データフレームのインポートに使用していますが、インポートしたデータフレームfilehash
は読み取り専用と見なす必要があることに気付きました。そのデータフレームのそれ以上の変更はすべて、再度保存しない限りファイルに保存されないため、あまり便利ではありません私の見解では、節約をすることを思い出す必要があるからです。これについて何かコメントはありますか?