私は長い間このような頭痛の種を抱えていました。現在、私の Hadoop クラスターはこのようなものです。実行する 40 個のスレーブ ノードがあり、各スレーブ ノードに 25 個のマッパーを構成します。同時に。さて、次の仕事があります:</p>
job1: 5 つのマッパーと 5 つの Reducer を実行するように構成します job2: 20 の Mapper と 10 の Reducer を実行するように構成します job3: 975 の Mapper と 385 の Reducer を実行するように構成します
デフォルトの FIFO ジョブ スケジューリングを使用するとします。3 つのマッパーを連続して送信すると、3 つのジョブが同時に実行される可能性はありますか? クラスタを最大限に活用するには?
現在、マッパーフェーズでは、3つのジョブを送信した後、1000マッパーが起動できるように見えることをテストしていますが、リデューサーフェーズでは、非常に遅くなり、長い時間待って、上記のジョブのどれも終了しません、レデューサーフェーズでハングしているようです。
この固有の理由がよくわかりません。ジョブを送信してスリープできるように、この問題について誰か助けてもらえますか? それを機能させるために公平なスケジューリングを使用する必要がありますか????