1

ジョブ トラッカーが作成するマッパーの数を計算するのは簡単です。基本的に、分割サイズで割った hdfs ファイルのサイズになります。したがって、hdfs ファイルのサイズが 640MB で分割が 64MB の場合、ジョブ トラッカーは 10 個のマッパーを作成します。しかし、作成されるマッパーの数が予想を超える場合があります。ジョブが終了したときに画面に表示されるプリントを見て、作成されたマッパーの数を把握します。

私の質問は次のとおりです。おそらく別のログを見て、より多くのマッパーが作成された理由を理解できますか?

:マップ削減ジョブがあり、同じジョブを異なる時間に実行すると、異なるマッパーが報告されます。作成される追加のマッパーは巨大ではありませんが。

4

1 に答える 1

1

ジョブ トラッカーによって生成されたログを読んで分かったのは、既に割り当てられているマッパーが完了するまでに時間がかかっている場合に余分なマッパーが作成されるということです。

Hadoop がそのようなタスクを割り当てると、次のように実行されます。

これは、ジョブ トラッカーが 5 番目のマップ タスクのジョブ 2 に最初のタスク試行を割り当てようとしていることを意味します。タスクの試行は 0 から始まります。

于 2013-03-17T03:53:43.397 に答える