3

私は、メール/電子メール/SMS の連絡先情報と履歴用の SQL Server DataMart を構築する計画段階にあります。各データは、異なる外部システムにあります。このため、電子メール アドレスにはアカウント番号がなく、SMS 電話番号には電子メール アドレスがありません。つまり、共有の主キーはありません。一部のデータは重複していますが、重複が発生した場合に最も完全なバージョンを保持する以外にできることはあまりありません。

このデータを使用して DataMart を構築するためのベスト プラクティスはありますか? 外部キーごとに列を持つキー テーブルを作成することは、許容される方法でしょうか? 次に、一意のプライマリ ID を割り当てて、これを他の DataMart テーブルに関連付けることができます。

私がまだ考えていないかもしれないアプローチに関するアイデア/提案を探しています。

ありがとう。

4

3 に答える 3

2

電子メール アドレスまたは電話番号自体が、適切なビジネス キーのように思えます。通常、「ステージング」データベースは、複数のソースからデータをロードし、代理キーを割り当てて他の変換を行うために使用されます。

データ ウェアハウスの方法と設計パターンに精通していますか? 事前の知識や経験がない場合は、助けを借りることを検討してください。BI / データ ウェアハウス プロジェクトは失敗率が非常に高く、ミスは高くつく可能性があります。

于 2010-10-12T15:30:54.993 に答える
1

ここで詳細情報を見つけました:

http://en.wikipedia.org/wiki/Extract,_transform,_load#Dealing_with_keys

于 2010-10-28T14:13:52.847 に答える
0

さて、異種の部分を結び付ける他の情報がなければ、データマートはかなり初歩的なものになるでしょう。データの種類(sms、電子メール、メール)、時間の経過に伴う各種類のメトリック(「今週/月/四半期/年は1日あたり平均42.5 smsのテキスト、1か月あたり8000通の電子メール!w00t」を取得できます。 !")。電話番号と電子メールアドレスだけで、「他のデータマート」は電話会社名またはインターネットドメインである必要があります。そこから、ある種の地理情報(インターネットプロバイダーの場所?)、または企業の財務情報にリンクできると思います。どちらの方向に進みたいかまだわからない場合は、一種のぼかしです。

正直なところ、これは、高官が「データマート」の流行語に対してひざまずく反応を示し、コミュニケーション指標の重要性について何かを聞いているように思われるため、チェーンの下流に「データマートを入手してください」という注文を送信しました。すべての電子メールで統計を実行してください!」

あなたまたはあなたの雇用主がこのプロジェクトから抜け出すことを期待しているのは何かを理解し、次にあなたが現在収集しているデータがあなたにその情報をたどる道を与えるかどうかを理解する必要があります。今、あなたはそれを逆行しているように聞こえます(「私はこのデータを持っています、それは何のために良いですか?」)。現在必要なデータがない可能性があります。つまり、データを購入するか(できるかどうかを知っている人)、収集を開始する必要があります。その場合、見栄えの良いグラフや傾向が得られません。上級管理職がしばらくの間見るべき行...警告dportasが彼の2番目の段落であなたに与えた警告と一致している;)

于 2010-10-14T00:24:20.163 に答える