5

データ ウェアハウスをモデリングする場合、ディメンション モデリングよりもData Vaultを優先する理由はありますか? これら2つの主な違いは何ですか?

4

5 に答える 5

12

私の意見では、ディメンション モデリングは分析とレポートのベスト プラクティスであり、ビジネス ユーザーが最もよく理解できる可視的なモデルです。

Data Vault は大規模なエンタープライズ データ ウェアハウジングに適しています。Bill Inmon も推奨していますが、「仮想」データ マートを作成するためにディメンション モデリングが必要になる可能性があるため、分析とレポート作成には適していません。Martijn Evers、Hennie de Nooijer、Ronald Damhof などのブログを参照してください。

Data Vault はより柔軟で、新しいソースを簡単に追加でき、より監査可能で、常にすべてのデータを保持するため、いつでも DM を再作成できます。

したがって、エンタープライズ データ ウェアハウスには Data Vault を使用し、Datamart には次元モデリングを使用するのが理想的な状況であるという結論になるかもしれません。

于 2011-04-24T13:43:39.003 に答える
4

この 2 つの組み合わせが、ほとんどの大規模な組織に最も適していると思います。Vault は、構造が少ないほど柔軟性とパフォーマンスが向上する中間エンタープライズ ODS に適しています。その後、Vault データベースからデータを取得して、レポートと分析をサポートするコンテキスト固有のディメンション データ マートにフィードできます。そのシナリオでは、vault Db を使用して、データ関係のより成熟した理解を必要とする、より多くのビッグデータ タイプのマイニングと分析をサポートすることもできます。

于 2015-03-18T13:28:12.223 に答える
2

@Danny Shawこれも私の経験です(私はこの分野では比較的新しいですが、ETLから来たので、私の投稿で他の人からの入力に興味があります)。

私は、クライアントの要求が「成熟度」とともに進化していること、および異なるモデルが異なる時期により適切に適合する可能性があることを尊重することが重要であると考えています.

私の感じでは、Data Vault は運用上の柔軟性を提供しますが、既存の議論 (Kimball/Inmon) は「ビジネスの柔軟性」を中心に展開しています (適切な用語がないため)。

Data Vault を使用すると、細分化されたオブジェクトという点でソースの近くに留まることができます。これにより、モデルが「監査可能」でスケーラブルになります。これは、SOURCE 仕様の柔軟性に役立ちます。

したがって、移行プロジェクトなどの中間に役立ち、新旧両方の統合ビューを必要とする、よりビジネス指向の DWH/データマートにフィードするためのベースとして機能します。しかし、私の経験では、このモデルから直接データマートにデータを入力し始めると、ビジネスの概念からかけ離れているという理由だけで、多くの結合と、特に再帰が発生することになります。特定のデータベースでは完全に悪いというわけではないので、選択はソフトウェアによって部分的に影響を受けます (たとえば、Teradata は Oracle よりも参加するのが好きです)。ただし、一般的には、TARGET (ビジネス) 側で柔軟性が必要な場合は、inmon-kimball の議論に行き着くので、その側でデータ ボールトの代わりに次元モデリングを検討することは悪いスタートではないと思います。

したがって、評価のインプットの一部には、ビジネス コンセプトがどの程度標準化されているかということも含まれている必要があります。会社全体で同じ KPI とデータの概念を使用していますか? そうでない場合は、データ ウェアハウスのどこかにソース (特にソースが多い場合) の近くにとどまることが安全な賭けのように思えます。より成熟している場合は、レポート要求の柔軟性を高める準備をし、データモデルのパフォーマンスをレポート側にシフトします。

これは、ビジネスが進化できないと言っているのではなく、全体として進化しなければならないということです。これはより「成熟した」顧客であり、データで何ができるかを知っており、ビジネスについて非常に統合された標準化されたビューを持っており、レポートに関する要件はますます複雑になっていると思います。したがって、データマートにフィードする際の柔軟性をモデル化する必要があり、かつ強力な ETL ツールセットを持っている場合は、データモデルを直接セットアップして、ビジネスにもう少し似たものにすることもできます。

要約すると、BI 環境が「成熟」するにつれて、ビジネスはデータで何ができるかを学び、その側の要求はより複雑になると私は主張します。Data Vault は、その方向に進む方法ではありません。

ただし、移行中 (特に何年にもわたる並行フェーズ) の場合、またはすべての部門が同じ目でビジネスを見ていない若い組織にいる場合、(有利な点として) レポートの要件はかなり監視可能です。前もってデータ ボールトを使用し、そこから直接データマートにデータを供給できるかどうかを確認してみてください。キンボールのディメンションのテイストをその間のどこかに追加することもできます。

于 2016-01-03T14:29:57.243 に答える
1

どのアプローチを優先するかは、通常、経験や意見と、システムのニーズや要件とのバランスの問題です。それぞれのモデリング アプローチには、さまざまな状況に関連する場合に特定の利点があるため、どのアプローチを採用するかを決定する際には、モデルが相互作用する環境を評価する必要があります。

通常、データを頻繁かつ一様に追加する高度なトランザクション システムは、次元モデリング アプローチに適しています。それを説明するために使用される一般的な例は、通常、小売および金融組織に焦点を当てています。これは、時間の経過とともに追加される販売または金銭取引の数が事実と次元の概念に適しているためです。

于 2011-04-19T13:37:17.273 に答える
0

どちらかが必要だと思うのはなぜですか。それらは主に、書籍やトレーニング コースの販売に使用される、専門用語を多用したデザイン パターンです。何百万人もの人々が、それらがなくても問題なく生活できることに気付いています。データ ウェアハウスを設計するために本当に必要なのは、あらゆるデータベースに必要な優れた分析とモデリングのスキルです。

データ ウェアハウスの構築に関する有益なアドバイスが必要な場合は、Bill Inmon の書籍を参照してください。これが初めてのビジネス インテリジェンス プロジェクトである場合は、よくある落とし穴を回避できるように、その分野で経験のある人から助けを求めてください。

于 2011-04-19T10:28:25.157 に答える