私は非常に単純な mongodb map reduce 状況を持っています。私はmysqlの世界で似たようなものが必要です:
select distinct(cookie) from table;
map reduce が mongo のツールであることがわかりました。だから私はこれを書いた:
map2 = Code("function () { emit(this.cookie, 1);}")
reduce2 = Code("function (key, values) {return 1;}")
totalunique = collection.map_reduce(map2, reduce2, out={"reduce":aggregatedcollection}, query=query).count();
ここまでは非常に単純です。これは cron で実行でき、最新の状態に保たaggregatedcollection
れています。タイムスタンプ変数を保存してクエリに入力し、すべての行を 1 回だけ処理するようにします。
これが私の質問です。タイムスタンプで、そのコレクションt1
に値があるとしましょう。c1
その直後、タイムスタンプで再度実行すると、値t2
が返されc2
ます。しかし、この次の での実行では、t2
を返したいのですが、 の新しい値を に保存したくありません。c2
c2
aggregatedcollection
別の言い方をすれば、 で 2 回目に実行して、 を返すようにしたいのt2
ですが、 (最初の実行からの値)だけが入力されています。c2
aggregatedcollection
c1
したがって、で実行した後、返してint2
にしたいのですが、これらがこの問題の唯一のパラメーターです。c2
c1
aggregatedcollection
map reduce 関数のout オプションに焦点を当てる必要があるようですが、それらのオプションのどれも私が望むものではないようです。
もちろん、コレクションを一時コレクションにコピーし、その作業を行ってからドロップすることもできますが、それには時間がかかりすぎます。