map - 何百万ものオブジェクトを含むcouchdbから1時間ごとにデータを取得する

Question

私は AWS EC2 ミディアムオンデマンドインスタンスで couchdb データベースをセットアップしています。その中には約 400 万のオブジェクトがあり、1 秒あたり約 100 オブジェクトの速度で増加しています。

その上にいくつかの map/reduce クエリを書きたいのですが、マップジョブが完了するまでに時間がかかります。そのため、データを他のマシンにコピーし、マスターマシン上のすべてのデータを削除してクリーンな状態に保つ必要があるかどうか疑問に思っています。データがコピーされる 2 番目のインスタンスにマップジョブを書き込む必要があります。また、このデータを s3 インスタンスに移動して、ここに 1 週間分のデータを保持することも考えています。

私は正しい方向に考えていますか

score 0 · Accepted Answer

独自のViewServerを作成するか、利用可能な実装の1つを使用して、パフォーマンスに役立つかどうかをテストできます。

score 0 · Accepted Answer

残念ながら、このような大きなデータベースでは、組み込みの reduce 関数しか使用できません。

_和
_カウント
_stats

これらの関数は、JavaScript の関数よりもはるかに高速に動作します。そして、これは巨大なデータベースに対して可能な唯一のオプションです。

http://wiki.apache.org/couchdb/Built-In_Reduce_Functions

map - 何百万ものオブジェクトを含むcouchdbから1時間ごとにデータを取得する

2 に答える 2

Related

Reference