「Hadoop 決定版ガイド」より [各 map タスクには、出力を書き込む循環メモリ バッファがあります。バッファはデフォルトで 100 MB ですが、このサイズは io.sort.mb プロパティを変更することで調整できます。バッファーの内容が特定のしきい値サイズ (io.sort.spill.percent、デフォルトは 0.80 または 80%) に達すると、バックグラウンド スレッドが内容をディスクにスピルし始めます]
ここでの問題は、各マップ タスクが 1 つの入力分割 (HDFS ブロックのサイズ、つまり 64 MB にほぼ等しい) で動作するため、ディスクにスピルバックする条件が発生しないことです。私は何かが欠けていますか?助けてください。