Data Vault モデリングについて読んだところですが、私が理解している限りでは、ハブにはキー (およびレコード ソース) しか含まれていません。レコード ソースを格納するためだけに、なぜこれらのハブ テーブルを作成する必要があるのでしょうか。サテライトとリンクだけで十分ではないでしょうか?
ところで:ダウンロードして遊ぶためのデータボールト形式の単純なmysqlテーブルを探しています。
Data Vault モデリングについて読んだところですが、私が理解している限りでは、ハブにはキー (およびレコード ソース) しか含まれていません。レコード ソースを格納するためだけに、なぜこれらのハブ テーブルを作成する必要があるのでしょうか。サテライトとリンクだけで十分ではないでしょうか?
ところで:ダウンロードして遊ぶためのデータボールト形式の単純なmysqlテーブルを探しています。
Data Vault モデリングの主な概念の 1 つは、ビジネス キー、詳細データ用のサテライト、およびハブを接続するためのリンクの分離です。
例
Employee
--------
Personnel Number
Name
Surname
Street
City
Department
--------
ID
Shortcode
Name
Employee Number
1 つの部門に 1 人の従業員しかいないと想像してください。
ビジネスキー
ここで、ビジネス オブジェクトEmployeeおよびDepartmentのビジネス ID を識別する必要があります。これは、EmployeeのPersonnel NumberとDepartmentのShortcodeになります。
DepartmentのIDではないのはなぜですか? ID はおそらくデータベースの内部 ID です。この例では、ショートコードは のようなもので、部門を識別するために内部的にも使用されます。DEP_A1613
モデリング
EmployeeのハブはフィールドPersonnel Numberのみで構成され、 DepartmentのハブはShortcodeのみで構成されます。
つまり、Data Vault モデリングのハブは、ビジネス キーのみを格納するためのものです。もちろん、Record Source、Load Dateなどの Data Vault フィールドも必要です。両方のハブには、データを記述するための対応するサテライトもあります。ハブなしでサテライトをリンクすることは、Data Vault モデリング手法に違反します。それも意味がありません。Hub を省略した場合には存在しない、Satellite データ用のある種の共通の識別子が必要です。
結論
あなたの質問に答えるには、ビジネス キーのハブをモデル化する必要があります。絶対。実際、ハブは Data Vault モデリングの重要な要素です。リンクはハブにのみ接続され、サテライトには接続されません。
Employee ソフトウェアの変更を想像してみてください。他のすべてのフィールドは、Employee サテライトに保存されます。新しいソースの従業員ソフトウェアを使用すると、同じハブとビジネス キーを使用しながら、すべてのデータを新しいサテライトに保存できます。
この例を完成させるために: リンクはEmployeeとDepartment を DepartmentからEmployee Numberに接続します。
編集
たとえば、構造は次のようになります。Data Vault 固有のフィールドは [DV] でマークされています。
Hub Employee
------------
Employee Hash Key [DV]
Load Date [DV]
Record Source [DV]
Personnel Number
Sat Employee
------------
Employee Hash Key [DV]
Load Date [DV]
Load End Date [DV]
Record Source [DV]
Hash Diff [DV]
Name
Surname
Street
City
Link Employee Department
------------------------
Employee Department Hash Key [DV]
Employee Hash Key [DV]
Department Hash Key [DV]
Hub Department
--------------
Department Hash Key [DV]
Load Date [DV]
Record Source [DV]
Shortcode
Sat Department
--------------
Department Hash Key [DV]
Load Date [DV]
Load End Date [DV]
Record Source [DV]
Hash Diff [DV]
ID
Name
ハブは、複数のソースのパッシブ統合が適用される場所です。データ ソースの列があり、ハブに最初に到着したときに各キーのすべてのインスタンスを記録します。たとえば、CRM システムと ERP システムがあり、最初に CRM システムからデータを同期すると、ERP データが利用可能になります。CRM システムのすべてのキーを追加し、データ ソース列の値を「CRM」にします。次に、ERP システムを導入するときに、テーブルのキー構造が同じであると仮定すると、「ERP」のデータ ソースを持つ ERP システムにのみ存在する新しいキーのみを追加します。キーが異なる場合は、両方のシステムからすべてのデータを追加する必要があります。ポイントは、使用中のすべてのシステムからのすべてのデータを保持しているということです。次のレイヤーに移動すると、ビジネス データ ボールトであれデータ マートであれ、「ビジネス ルール」に従ってハブとサテライトに対してビジネス ロジックを適用し、該当する 2 つのシステムの 1 つの結果行を取得します。この中間状態に格納する前に変換を使用すると、監査機能が失われ、後でビジネス ルールを変更する機能が失われます。わかる?