私は中規模のデータベース (〜 400,000 行、27 列) を持っており、比較のために同じ基準でほとんどの列 (25 列) を検索する必要があります。データを「長い」形式に再形成/溶解する方が効率的であると考えたので、reshape2 パッケージを使用して ~9,000,000 行/4 列のデータセットを生成しました。非常に長い時間がかかることを除けば (私は 2GB の RAM しか持っていません)、再形成されたファイルのサイズは 500MB と巨大でした。
より効率的/計算量の少ない方法はありますか?
- 幅の広いデータから長いデータへの再形成と保存?
- 再形成をまったく回避し、同じ検索条件で複数の列を検索しますか?