1

最近では、いくつかのハイブステートメントを書いていますが、ハイブステートメントを統合するときに、いくつかの問題がありました.これの具体的な状況(Hadoopクラスターを使用):

走っているとき:</p>

from tmp
  insert overwrite local directory '/tmp/out/jpg'
  select count(1) where logdate=0222 and req_uri regexp '\.(jpg|JPG)';

また

from tmp
  insert overwrite local directory '/tmp/out/jpg_hit'                 
  select count(1) where logdate=0222 and req_uri regexp '\.(jpg|JPG)' and hit_status="hit";

結果は「/tmp/out/jpg」または「/tmp/out/jpg_hit」のすぐ下にあります。両方のファイルは 1 つだけです。結果はファイルにあります (2 つの結果は等しくありません)。

しかし、私が走っているとき:</p>

 from tmp
  insert overwrite local directory '/tmp/out/jpg'
  select count(1) where logdate=0222 and req_uri regexp '\.(jpg|JPG)'
  insert overwrite local directory '/tmp/out/jpg_hit'                 
  select count(1) where logdate=0222 and req_uri regexp '\.(jpg|JPG)' and hit_status="hit";

「/tmp/out/jpg」または「/tmp/out/jpg_hit」の下に、両方とも多くのファイルがあり、各ファイル番号を合計すると、2 つの結果が等しく、大きな数に等しいことがわかりました。結果は次のとおりです。エラー。問題を解決する方法をお尋ねしてもよろしいですか?

4

0 に答える 0