1000 個のマップ タスクを生成する MapReduce ジョブを考えてみましょう。ブロックサイズ: 128MB 最小分割サイズ: 1MB 最大分割サイズ: 256MB
ブロックサイズが限界値のようです。ブロック サイズを超えて分割サイズを大きくすることはできますか?
これは FileInputFormat.java の関数です。
protected long computeSplitSize(long goalSize, long minSize, long blockSize) {
return Math.max(minSize, Math.min(goalSize, blockSize));
}
上記の関数に基づいて、ブロックサイズより大きい最小分割サイズは、私が望むことを行います。この方法で最小分割サイズを設定することの副作用に誰かが光を当てることができますか?