MongoDBマップリデュースジョブを書き直して、代わりにHadoopを使用します(mongo-hadoopコネクタを使用)が、2つのデータセットを同じコレクションにマップすると、値を使用する代わりに上書きします
{reduce: "collectionName"}-結果セットと古いコレクションに特定のキーのドキュメントが存在する場合、2つの値に対して(指定されたreduce関数を使用して)reduce操作が実行され、結果は次のように書き込まれます。出力コレクション。ファイナライズ関数が提供されている場合、これはリデュース後にも実行されます。
mongo-hadoopを使用してどのように行われますか?