こんにちは...少し混乱しています。リデュース タスクとリデュース ジョブの違いは何ですか? これが私の場合です。すべてのマッピングが完了するまでreduceが開始されないことを読みました...しかし、hadoop出力ではそうではありません:
12/02/11 10:58:50 INFO mapred.JobClient: map 60% reduce 16%
12/02/11 10:58:54 INFO mapred.JobClient: map 60% reduce 20%
12/02/11 10:58:55 INFO mapred.JobClient: map 65% reduce 20%
削減率は 16% ですが、マップはまだ 60% です... ここで実際に何が起こっているのでしょうか?