私は AWS EC2 ミディアム オンデマンド インスタンスで couchdb データベースをセットアップしています。その中には約 400 万のオブジェクトがあり、1 秒あたり約 100 オブジェクトの速度で増加しています。
その上にいくつかの map/reduce クエリを書きたいのですが、マップ ジョブが完了するまでに時間がかかります。そのため、データを他のマシンにコピーし、マスター マシン上のすべてのデータを削除してクリーンな状態に保つ必要があるかどうか疑問に思っています。データがコピーされる 2 番目のインスタンスにマップ ジョブを書き込む必要があります。また、このデータを s3 インスタンスに移動して、ここに 1 週間分のデータを保持することも考えています。
私は正しい方向に考えていますか