データベースのインデックス作成方法: Xenph Yan からの回答を参照
テーブル内のフィールドにインデックスを作成すると、フィールド値と、それに関連するレコードへのポインターを保持する別のデータ構造が作成されます。次に、このインデックス構造がソートされ、バイナリ検索を実行できるようになります。
私がORCのインデックス作成を理解した方法は、ORCが10'000行ごとに(デフォルトで)行に関する統計(最小、最大、合計)を保持し、データを照会すると、統計を見て、読み取る必要があるかどうかを判断することです行チャンクかどうか。
では、ORC のインデックス作成ではデータが並べ替えられないというのは正しいでしょうか?
非常に構造化されていないデータを含む 69 列の大きなテーブルがあり、すべての列でアドホック クエリを実行できるようにしたいと考えています。そのためには、すべての列をインデックス (または少なくともそれらのほとんど) で並べ替えられるようにしたいと考えています。高速に照会されるデータには「キー」列はありません。