最近では、いくつかのハイブステートメントを書いていますが、ハイブステートメントを統合するときに、いくつかの問題がありました.これの具体的な状況(Hadoopクラスターを使用):
走っているとき:</p>
from tmp
insert overwrite local directory '/tmp/out/jpg'
select count(1) where logdate=0222 and req_uri regexp '\.(jpg|JPG)';
また
from tmp
insert overwrite local directory '/tmp/out/jpg_hit'
select count(1) where logdate=0222 and req_uri regexp '\.(jpg|JPG)' and hit_status="hit";
結果は「/tmp/out/jpg」または「/tmp/out/jpg_hit」のすぐ下にあります。両方のファイルは 1 つだけです。結果はファイルにあります (2 つの結果は等しくありません)。
しかし、私が走っているとき:</p>
from tmp
insert overwrite local directory '/tmp/out/jpg'
select count(1) where logdate=0222 and req_uri regexp '\.(jpg|JPG)'
insert overwrite local directory '/tmp/out/jpg_hit'
select count(1) where logdate=0222 and req_uri regexp '\.(jpg|JPG)' and hit_status="hit";
「/tmp/out/jpg」または「/tmp/out/jpg_hit」の下に、両方とも多くのファイルがあり、各ファイル番号を合計すると、2 つの結果が等しく、大きな数に等しいことがわかりました。結果は次のとおりです。エラー。問題を解決する方法をお尋ねしてもよろしいですか?