mysql - データ保管庫モデル: ハブは何に適していますか?

Question

Data Vault モデリングについて読んだところですが、私が理解している限りでは、ハブにはキー (およびレコードソース) しか含まれていません。レコードソースを格納するためだけに、なぜこれらのハブテーブルを作成する必要があるのでしょうか。サテライトとリンクだけで十分ではないでしょうか?

ところで：ダウンロードして遊ぶためのデータボールト形式の単純なmysqlテーブルを探しています。

score 3 · Accepted Answer

Data Vault モデリングの主な概念の 1 つは、ビジネスキー、詳細データ用のサテライト、およびハブを接続するためのリンクの分離です。

例

Employee
--------
Personnel Number
Name
Surname
Street
City

Department
--------
ID
Shortcode
Name
Employee Number

1 つの部門に 1 人の従業員しかいないと想像してください。

ビジネスキー

ここで、ビジネスオブジェクトEmployeeおよびDepartmentのビジネス ID を識別する必要があります。これは、EmployeeのPersonnel NumberとDepartmentのShortcodeになります。

DepartmentのIDではないのはなぜですか? ID はおそらくデータベースの内部 ID です。この例では、ショートコードはのようなもので、部門を識別するために内部的にも使用されます。DEP_A1613

モデリング

EmployeeのハブはフィールドPersonnel Numberのみで構成され、 DepartmentのハブはShortcodeのみで構成されます。

つまり、Data Vault モデリングのハブは、ビジネスキーのみを格納するためのものです。もちろん、Record Source、Load Dateなどの Data Vault フィールドも必要です。両方のハブには、データを記述するための対応するサテライトもあります。ハブなしでサテライトをリンクすることは、Data Vault モデリング手法に違反します。それも意味がありません。Hub を省略した場合には存在しない、Satellite データ用のある種の共通の識別子が必要です。

結論

あなたの質問に答えるには、ビジネスキーのハブをモデル化する必要があります。絶対。実際、ハブは Data Vault モデリングの重要な要素です。リンクはハブにのみ接続され、サテライトには接続されません。

Employee ソフトウェアの変更を想像してみてください。他のすべてのフィールドは、Employee サテライトに保存されます。新しいソースの従業員ソフトウェアを使用すると、同じハブとビジネスキーを使用しながら、すべてのデータを新しいサテライトに保存できます。

この例を完成させるために: リンクはEmployeeとDepartment を DepartmentからEmployee Numberに接続します。

編集

たとえば、構造は次のようになります。Data Vault 固有のフィールドは [DV] でマークされています。

Hub Employee
------------
Employee Hash Key [DV]
Load Date [DV]
Record Source [DV]
Personnel Number

Sat Employee
------------
Employee Hash Key [DV]
Load Date [DV]
Load End Date [DV]
Record Source [DV]
Hash Diff [DV]
Name
Surname
Street
City

Link Employee Department
------------------------
Employee Department Hash Key [DV]
Employee Hash Key [DV]
Department Hash Key [DV]

Hub Department
--------------
Department Hash Key [DV]
Load Date [DV]
Record Source [DV]
Shortcode

Sat Department
--------------
Department Hash Key [DV]
Load Date [DV]
Load End Date [DV]
Record Source [DV]
Hash Diff [DV]
ID
Name

score 2 · Accepted Answer

ハブは、複数のソースのパッシブ統合が適用される場所です。データソースの列があり、ハブに最初に到着したときに各キーのすべてのインスタンスを記録します。たとえば、CRM システムと ERP システムがあり、最初に CRM システムからデータを同期すると、ERP データが利用可能になります。CRM システムのすべてのキーを追加し、データソース列の値を「CRM」にします。次に、ERP システムを導入するときに、テーブルのキー構造が同じであると仮定すると、「ERP」のデータソースを持つ ERP システムにのみ存在する新しいキーのみを追加します。キーが異なる場合は、両方のシステムからすべてのデータを追加する必要があります。ポイントは、使用中のすべてのシステムからのすべてのデータを保持しているということです。次のレイヤーに移動すると、ビジネスデータボールトであれデータマートであれ、「ビジネスルール」に従ってハブとサテライトに対してビジネスロジックを適用し、該当する 2 つのシステムの 1 つの結果行を取得します。この中間状態に格納する前に変換を使用すると、監査機能が失われ、後でビジネスルールを変更する機能が失われます。わかる？

mysql - データ保管庫モデル: ハブは何に適していますか?

2 に答える 2

Related

Reference