現在、Hive でデータ探索を行っていますが、次の動作を説明できません。フィールド master_id を持つテーブル (mytable という名前) があるとします。
取得する行数を数えると
select count(*) as c from mytable
c
1129563
null 以外の master_id を持つ行の数をカウントしたい場合は、より高い数を取得します
select count(*) as c from mytable where master_id is not null
c
1134041
さらに、master_id が null になることはないようです。
select count(*) as c from mytable where master_id is null
c
0
whereステートメントを追加すると、最終的に行数が増える可能性があることを説明できません。この動作を説明するヒントはありますか?
ありがとう