1

通常、データ ウェアハウスは、通常はレポート目的で、複数のソース システムを統合する手段です。しかし、データ ウェアハウスをそれ自体でプライマリ データベースとして使用すること (つまり、データを別のシステムからロードするのではなく、データをキャプチャして管理すること) を使用することをお勧めする状況はありますか?

4

3 に答える 3

5

短い答え -いいえ、そうは思いません。最初に、本番データベース用に適切で正規化されたデータベース構造を設計し、後でデータ ウェアハウスの部分について検討する必要があります。

ウェアハウスと本番データベースを分離しておくことは、「ベスト ビジネス プラクティス」と見なされます。おそらく最も重要なのは、設計上の考慮事項です。データ ウェアハウスと運用データベースには、2 つの異なる目的があります。本番データベースのおそらく最も重要な機能は、トランザクションを確実に、一貫して、明確にキャプチャすることです。これは、データベースを設計するときと、データベース エンジンなどのソフトウェアを選択するときの両方で重要です。

その設計部分を過小評価してはなりません。ほとんどのプロジェクトでは、優れたデータベース設計は、最初に行うべきことの 1 つです。テーブル構造を正しくすることは、テクノロジーを選択することよりも重要です。

拡張を計画している場合は、データを別のデータベースに少し分離してみることも理にかなっています。これは、後でデータベースを分割し、別のハードウェアで別の部分を実行するのが簡単になるためです ( 「最先端」、より強力なサーバーを購入するよりも、より多くのサーバーを購入する方がはるかに安価です)、および後でソフトウェアモジュールを分割したり、互いに独立して再利用したりする可能性があるためです. データ ウェアハウスを同じように分割したくないでしょう。

要約すると、実稼働データベースから開始し、後でデータ ウェアハウスを構築します。これは通常、さまざまなソースからのデータを結合するか、実稼働データベースに冗長性を追加してレポートを高速化する衝動に駆られるまで延期できます。


私はオンラインギャンブル会社で8年間働いていました。私は実稼働データベースの設計に参加し、後にデータ ウェアハウスの構築を担当しました。そのため、上記のコメントは、いくつかの過ちと学んだ経験に基づいています。

于 2012-07-02T20:16:54.300 に答える
0

@tobixenによる良い要約。Datawarehouseのベストプラクティスに関するもう1つの点は、データを変更せず、通常はデータを追加することです(履歴が保持されます)。

ほとんどのデータウェアハウステクノロジーは、このパターンを対象としています。したがって、データウェアハウス上で一般的なOLTPシステムまたはマスターデータシステムを使用すると、正しく機能しません。

一般的な流れは

OLTPデータベース->データウェアハウス>アーカイブ。

OLTPデータベースは、たとえば1か月から13か月のデータを保持する場合があります。データウェアハウスは、最大5/10年(すべての詳細ではなく、おそらく要約されている)のデータを保持してから、アーカイブに進みます。

Hadoop / Hiveのようなビッグデータテクノロジーにより、大量のデータ(たとえば、10年)を簡単に保存し、費用対効果の高い方法で処理できるようになっていると言われています。

于 2012-07-04T06:25:56.780 に答える
0

一般的にはそうではないと言わざるを得ませんが、Twitter データを収集する「OLTP」システムをソース システムの 1 つとして持つ DWH を構築するよう求められています。この場合、Twitter の収集「OLTP」システムは 1 週間分のデータしか保持せず、毎日それを DWH に渡して保管し、その後、毎日要約情報を Twitter OLTP システムに送り返すと思います。この場合、私たちは Twitter データのプライマリ データ リポジトリになります。正直に言うと、これは初めてのケースです。

私は@Sathish Senahiに同意しません.「データウェアハウスはデータを5年/10年まで保持します(すべての詳細ではなく、おそらく要約されています)」という声明について考えます。DWH に入るデータを要約することは決してなく、常に最も粒度の低いトランザクション データを保持しますが、明らかに OLTP システムにあるすべての属性ではありません。

私は非常に大規模なデータを扱うオンライン ギャンブルに携わったことがないことを認めますが、数テラバイトの DWHe を持つ電気通信と保険に携わったことがあります。私たちは常に、通話の詳細または保険料/請求の取引そのものを保存します。

于 2012-08-23T15:32:02.587 に答える