Redshift では、複数の列を列として指定できますSORTKEY
が、ほとんどのベスト プラクティス ドキュメントは、SORTKEY が 1 つしかないかのように記述されています。
でテーブルを作成するとSORTKEY (COL1, COL2)
、すべての列が COL1、次に COL2 でソートされて保存されるということですか? それとも、カラム型ストアであるため、各カラムが異なる順序で格納されるのでしょうか? つまり、COL1 の順序で COL1、COL2 の順序で COL2、および順序付けされていない他の列ですか?
私の状況は、(とりわけ)type_idとtimestamp列を持つテーブルがあるということです。データはほぼタイムスタンプ順に到着します。ほとんどのクエリは、type_id とタイムスタンプの両方に対して結合/制限されます。通常、type_id 句はより具体的です。つまり、timestamp 句を確認するよりも type_id 句を確認することで、より多くの行を除外できます。このため、type_id は DISTKEY です。SORTKEY (type_id)
、、、SORTKEY (stamp)
の長所と短所SORTKEY (type_id,stamp)
を理解しようとしていSORTKEY (stamp,type_id)
ます。
ありがとう。