データ ウェアハウス (DW) を構築中ですが、データの読み込みについて質問があります。この点について、ご意見をお聞かせいただければ幸いです。
最初にステージング データベースにすべてのテーブルを 1 対 1 でロードし、次にステージング データベースから DW にデータをロードすることを計画しています。OLTP システムを直接 (ステージングなしで) 攻撃することを考えましたが、これがパフォーマンスの観点から最善のアプローチであると 100% 確信できるわけではありません。
例を挙げましょう。OLTP データベースには Customers というビューがあり、これを DW に取り込みます。OLTP データベースのビューは非常に複雑で、select ステートメントには 8 分かかります。したがって、このテーブルを DW に直接ロードして増分ロードを実行すると、最初にビューをステージング テーブルにロードするよりも時間がかかると考えられます。また、ロードには時間がかかるため、ユーザーがデータをクエリに使用できなくなるため、DW の可用性にも影響が及びます。
あなたたちは何を提案しますか?ステージング アプローチは現在時代遅れになっていますか? 長所と短所が何であるかを理解したい。よろしくお願いいたします。