強力な RDBMS に保持されている 2 つのソース テーブルからデータを読み取る、1 日 1 回実行されるバッチ分析 SQL ジョブがあります。ソース テーブルは巨大 (>100 TB) ですが、結合されたフィールドは 10 未満です。
私が持っている質問は、2 つのソース テーブルを圧縮されインデックス化されたフラット ファイルに保持できるので、操作全体がはるかに高速になり、ストレージを節約でき、低スペックのサーバーで実行できるかということです。また、これらの圧縮されインデックス化されたフラット ファイルに対して SQL のようなクエリを実行できますか? これを行う方法についての指針は非常に役立ちます。