パラメータ「mapred.min.split.size」は、ファイルが以前に書き込まれたブロックのサイズを変更しますか? JOB を開始するときに、パラメーター「mapred.min.split.size」を 134217728 (128MB) の値で渡す状況を想定します。何が起こるかについて、何と言うのが正しいですか?
1 - 各 MAP は 2 つの HDFS ブロックに相当する処理を行います (各ブロックが 64MB と仮定)。
2 - HDFS 128M のブロックを占有するために、入力ファイル (以前は HDFS に含まれていた) の新しい分割があります。