Hive クエリのパフォーマンスの向上について、いくつか質問をしました。回答のいくつかは、マッパーとリデューサーの数に関するものでした。複数のマッパーとリデューサーを試してみましたが、実行に違いは見られませんでした。理由はわかりません。私のやり方が間違っていたのか、何か他のことを見逃していたのかもしれません。
Hive クエリを並行して実行することは可能ですか? つまり、通常、クエリはキューで実行されます。例: query1
クエリ2
クエリ3
. . . n
実行に時間がかかりすぎて、実行時間を短縮したい。
Hive JDBC プログラムで mapreduce プログラムを使用するかどうかを知る必要があります。それを並行して実行することは可能ですか? それがうまくいくかどうかはわかりませんが、それが私の目標ですか?
以下の質問を元に戻します。
1) 複数の Hive クエリを並行して実行できる場合、複数の Hive Thrift Server が必要ですか?
2) 複数の Hive Thrift サーバーを開くことは可能ですか?
3) 同じポートで複数の Hive Thrift サーバーを開くことはできないと思いますか?
4) 異なるポートで複数の Hive Thrift サーバーを開くことはできますか?
これに対する解決策を教えてください。他に選択肢があれば、それも試してみます。