4つのコアノードを使用しています..
ハイブを使用してテーブルでクエリを実行しています。
さまざまなクエリが容量を使用しているようです。
私のテーブルは、8 つの整数フィールドと約 1000 行で構成されています。
フォームのクエリ
tbl から avg(col1-col2) を選択します。tbl から count(*) を選択します。私が試した他のすべてのクエリは生成されています
レデューサーの数=1、マッパーの数=1
set mapred.reduce.tasks=4; を使用してみました。
しかし、うまくいきません。
最も奇妙なことは、mapred.job.tracker=local を使用すると、ローカル ノード自体で 1 つのマップと 1 つのリデュースを使用すると、タスクが 2 倍速く終了することです。
1 つを除くすべての reduce/map スロットは常に開いています。
容量を追加しても実行時間が少しでも改善されないのはなぜですか? データ サンプルが小さすぎて、容量を増やしても問題がなく、マッピングと削減をローカライズすることで実際に時間が改善されますか?