3

200個の入力ファイルと20個のノードがあり、各ノードに10個のマッパースロットがあるとします。Hadoopは、各ノードが10個の入力ファイルを取得し、同時に10個のマッパーを開始するように、常に作業を均等に割り当てますか?この動作を強制する方法はありますか?

4

1 に答える 1

2

使用されるマッパーの数は、入力、特に入力分割によって決まります。したがって、あなたの場合、200 個のファイルを 200 個のマッパーに供給することができます。しかし、本当の答えはもう少し複雑です。による

  • file size : ファイルがブロック サイズより大きい場合、ブロック サイズのチャンクがマッパーに送信されます

  • ファイルは分割可能です。たとえば、gzip 圧縮ファイルは分割できません。そして、1 つのファイル全体が 1 つのマッパーに送られます (ファイルがブロック サイズよりも大きい場合でも)。

于 2013-03-13T23:15:33.230 に答える