Hive for Hadoop が不等結合をサポートしていないことは承知しています。ただし、問題なく実行できるクエリがあります。結果が正しいかどうかについては、これを共有した同僚が正しい結果をもたらさないことに気付いたので、私は疑わしい.
ここにあります:
select foo.id, count(foo.*) as foo_vol, count(bar.*) as bar_vol
from foo
left outer outer join bar
on foo.id = bar.id
and (bar.f2 in (x, y, z)) = FALSE
group by foo.id
なぜこれが説明され、正常に実行されるのかについて、誰かが何か考えを持っていますか? 不等結合の問題は、基準が結合の両側のフィールドを使用するかどうかに実際に関連していますか? FB / apache は、このタイプのクエリが間違った結果を生成することを確認しましたか?
どんな助けにも乾杯、マット