入力ファイル F によって供給される m マッパーを使用する map-reduce ジョブを想定します。明らかに、mapreduce フレームワークは F をチャンク (デフォルト値として 64 MB) に分割し、各チャンクをマッパーに供給します。私の質問は、この mapreduce ジョブを数回実行した場合、チャンクが形成される方法はそれらすべてで同じですか? つまり、mapreduce フレームワーク分割 F のポイントは同じままですか、それとも異なる可能性がありますか?
例として、F に次の行が含まれているとします。
1,2
3,5
5,6
7,6
5,5
7,7
最初の実行では、mapreduce は次のように 2 つのチャンクを形成します。
チャンク 1:
1,2
3,5
5,6
チャンク 2:
7,6
5,5
7,7
私の質問は、分割を再度実行した場合、分割の方法が同じままであるかどうかです。
さらに、各チャンクにはマッパーで使用できる一意の名前がありますか?