ここで少し背景:
多かれ少なかれ、データウェアハウスが何であるかを知っています。データ ウェアハウジングに関するガイドを数十冊読み、SSAS で遊んでみました。スター スキーマとディメンション テーブルとファクト テーブルが何であるかを知っています。ETL とは何か、またその方法も知っています。 これは「方法」の質問でも、チュートリアルのリクエストでもありません。
私の問題は、私が読んだデータ ウェアハウスに関する資料のすべてが、データウェアハウスを構築する根拠を曖昧にしているように見えることです。それらはすべて比喩的に、または場合によっては文字通り「だからあなたはデータウェアハウスを構築することに決めました...」というフレーズで始まりますが、私はまだその決定を下していません。
だから私は、SO のメンバーが、ある種の半客観的なテストを私に指摘したり、考え出すのを手伝ってくれることを望んでいます. 特定のシステムに適応して、最終的に「はい、データ ウェアハウスが必要です」または「いいえ、今日の見返りは小さすぎる」という結果になるものです。私が答えることができるはずの具体的な質問は次のとおりだと思います。
データ ウェアハウスの構築を検討する価値のあるオプションは、どの時点ですか? 言い換えれば、標準的なトランザクション環境がもはや十分ではないことを示している可能性がある兆候、メトリック、またはその他の基準を確認する必要がありますか?
完全なデータ ウェアハウスに代わるものは何ですか? トランザクション データベースの非正規化とボグ標準のレプリケートされた "レポート サーバー" の 2 つが思い浮かびます。DW にコミットする前に調査すべきものは他にありますか?
データ ウェアハウスが上記の代替案よりも優れているのはなぜですか? 答えが「依存する」である場合、それは何に依存していますか?
データ ウェアハウスの構築を試みてはいけないのはどのような場合ですか? コンテキストに関係なく、「ベストプラクティス」として宣言されているものには懐疑的です。確かに、DW が間違った選択であるシナリオがいくつかあるに違いありません。
データ ウェアハウスの導入によって改善されたシステムの実際の例はありますか? 彼らがどのような決定や分析のために倉庫を必要としたか、倉庫に何を入れるかをどのように決定したか、倉庫が最終的により大きな環境にどのように適合したかをエンドツーエンドで説明してくれる何か? 「AdventureWorks データベースから立方体を作ろう」というわざとではありません。実装は私には関係ありません。仕様と設計、および関連する全体的な思考プロセスに興味があります。
私は通常、マルチパートに尋ねないようにしていますが、これらはすべて非常に密接に関連していると思います. 少なくとも最初の 4 つの質問に対応する回答であれば喜んで受け入れますが、最後の質問は私の頭の中でこれを具体化するのに本当に役立ちます。これについて誰かがすでに書いている場合は、リンクが適度に簡潔で具体的であれば問題ありません (Ralph Kimball のホームページへのリンク = 役に立ちません)。
質問が明確になったことを願っています-回答ありがとうございます!