私は2つのテーブルを持っています。
一方はバケット化されていますが、他方はそうではありません - それらが同一であることを除いて。
両方とも orc として保存され、パーティション化されています。
特定のパーティションでバケット テーブルをクエリすると、同じパーティションでそのツインをクエリするよりもはるかに遅くなります。
それは期待されていますか?
そうでない場合、その理由は何ですか?
はいの場合、バケット化されたテーブルを保持する唯一の動機は結合とサンプリングであると結論付ける必要があります。この場合、テーブルの 2 つのコピーを保持します。
質問する
550 次