1

最初の質問:スプリットが何らかの方法でブロックを変更するかどうかを知りたいです (つまり、サイズの変更、ブロックの別の場所への移動、新しいブロックの作成など)。

2 番目の質問:分割によってブロックが変更されることはないと思いますが、DataNodes が既に実行されており、ブロックを持っているため、分割が行われると思われるため、データの局所性またはラック認識のために、各 MapTask が存在し、クラスター上で実行される場所が指定されます。データを含むノードの横で MapTask を実行するように Hadoop に指示します。注意: InputSplit の内部には、この目的のために考えられる Location/Host があります。私が間違っている場合は修正してください

3 番目の質問:最初にタスクを実際に実行する前に、ブロックは MapTask のある場所に移動しますか、それとも MapTask はブロックがある場所 (つまり、DataNode の場所) に移動しますか?

4

1 に答える 1