0

MongoDBマップリデュースジョブを書き直して、代わりにHadoopを使用します(mongo-hadoopコネクタを使用)が、2つのデータセットを同じコレクションにマップすると、値を使用する代わりに上書きします

{reduce: "collectionName"}-結果セットと古いコレクションに特定のキーのドキュメントが存在する場合、2つの値に対して(指定されたreduce関数を使用して)reduce操作が実行され、結果は次のように書き込まれます。出力コレクション。ファイナライズ関数が提供されている場合、これはリデュース後にも実行されます。

mongo-hadoopを使用してどのように行われますか?

4

2 に答える 2

2

Mongo-Hadoop は現在、ターゲット コレクションの上書きのみをサポートしています。ただし、複数のジョブをチェーンして、古いコレクションからも読み取る新しいジョブに MR 出力を送信できるようにすることは可能です。

于 2012-07-16T19:04:12.213 に答える
0

これを探している他の人にとっては、複数入力のサポートが間もなく開始されます。

変更のあるブランチはここにあります。かなりよくできていて、本番環境で使用しています。

于 2012-08-10T14:32:24.263 に答える