google-bigquery - null 許容フィールドを持つ BigQuery テーブルに対するクエリパフォーマンス

Question

ログから Google BigQuery にデータをアップロードする必要があり、クエリ時に重複しないログデータの 2 つのサブセットがあります。

null 可能な「vendor_id」フィールドを持つテーブルを 1 つだけ作成するか、サブセットごとに 2 つの異なるテーブルを作成することができます。これらのアプローチのパフォーマンスに違いはありますか?

よろしく

レオ

score 2 · Accepted Answer

あなたが言及した2つのオプションの間で、クエリのパフォーマンスに（あるとしても）ほとんど違いはありません。つまり、クエリのコストは読み取られるデータの量に比例するため、2 つの個別のテーブルがある場合、各クエリが読み取るデータ量が少なくなるため、コストが低くなる可能性があります。

google-bigquery - null 許容フィールドを持つ BigQuery テーブルに対するクエリ パフォーマンス