テーブルを作成するときに、分散で複数の列を使用する利点はありますか?例えば:
CREATE TABLE data_facts (
data_id int primary key,
channel_id smallint,
chart_id smallint,
demo_id smallint,
value numeric)
DISTRIBUTED BY (
channel_id,
chart_id,
demo_id)
data_facts
チャンスがあるので、3つの異なるテーブルと結合し、それぞれchannel
、chart
をdemo
使用する必要があります。channel_id
chart_id
demo_id
具体的には、
- 効率の観点から、参加に使用しているものをすべて追加
distribution
して含める必要がありますか?id(s)
- もしそうなら、これらの順序は
id(s)
重要ですか? - これはアーキテクチャレベルでどのように機能しますか?(オプション)
ありがとう!