毎回マッパーを使用せずにデータを複数回ソートする方法をトラブルシューティングしています。
Id like to setup: マッパー 1 --> レデューサー 1 ---> レデューサー 2 ---> レデューサー 3
レデューサー 1 の出力 (キー、データ) を作成し、それをレデューサー 2 に直接送りたい...これは可能ですか?
トラブルシューティングでジョブをチェーンできることを知りましたが、これには各ステップにマッパーが必要ですか?
マッパーなしで実行しようとすると、エラーで終了します。レデューサー1から必要に応じて出力できる場合、各ステップでマッパーを実行するのは時間/リソースの無駄になるようです。
考え?