クエリの先頭に次を追加してみました:
set mapred.running.reduce.limit = 25;
と
set hive.exec.reducers.max = 35;
最後の 1 つは、530 のレデューサーを 35 に減らしたジョブを投獄しました...これは、530 のレデューサーに相当する作業を 35 にしようとしていたと思います。
今与えている
set mapred.tasktracker.reduce.tasks.maximum = 3;
その数がノードあたりの最大値であるかどうかを確認してください (以前は、70 の潜在的なリデューサーを持つクラスターでは 7 でした)。
アップデート:
set mapred.tasktracker.reduce.tasks.maximum = 3;
効果はありませんでしたが、試してみる価値はありました。