java - hadoopのmongo'sout：reduceオプションに相当します

Question

MongoDBマップリデュースジョブを書き直して、代わりにHadoopを使用します（mongo-hadoopコネクタを使用）が、2つのデータセットを同じコレクションにマップすると、値を使用する代わりに上書きします

{reduce： "collectionName"}-結果セットと古いコレクションに特定のキーのドキュメントが存在する場合、2つの値に対して（指定されたreduce関数を使用して）reduce操作が実行され、結果は次のように書き込まれます。出力コレクション。ファイナライズ関数が提供されている場合、これはリデュース後にも実行されます。

mongo-hadoopを使用してどのように行われますか？

score 2 · Accepted Answer

Mongo-Hadoop は現在、ターゲットコレクションの上書きのみをサポートしています。ただし、複数のジョブをチェーンして、古いコレクションからも読み取る新しいジョブに MR 出力を送信できるようにすることは可能です。

score 0 · Accepted Answer

これを探している他の人にとっては、複数入力のサポートが間もなく開始されます。

変更のあるブランチはここにあります。かなりよくできていて、本番環境で使用しています。

java - hadoopのmongo'sout：reduceオプションに相当します

2 に答える 2

Related

Reference