0

ログから Google BigQuery にデータをアップロードする必要があり、クエリ時に重複しないログ データの 2 つのサブセットがあります。

  1. サブセット番号 1 には、WHERE 句で頻繁に使用されるフィールド「vendor_id」があります。
  2. サブセット番号 2 は、「vendor_id」を持たないログ エントリです。

null 可能な「vendor_id」フィールドを持つテーブルを 1 つだけ作成するか、サブセットごとに 2 つの異なるテーブルを作成することができます。これらのアプローチのパフォーマンスに違いはありますか?

よろしく

レオ

4

1 に答える 1

2

あなたが言及した2つのオプションの間で、クエリのパフォーマンスに(あるとしても)ほとんど違いはありません。つまり、クエリのコストは読み取られるデータの量に比例するため、2 つの個別のテーブルがある場合、各クエリが読み取るデータ量が少なくなるため、コストが低くなる可能性があります。

于 2013-04-18T22:37:08.037 に答える