0

スター スキーマ データ ウェアハウスにデータをインポートする方法を見つけるために、Web 上のあらゆる場所を検索しました。スター スキーマとデータ ウェアハウスの設計についてはオンラインで多くの情報が説明されていますが、データがどのように DW に読み込まれるかについては説明されていません。これが私がこれまでに行ったことです:

各選手の高校バスケットボールの統計を応用しようとしています。

私は持っている:

  1. すべての選手の名前、身長、ポジション、背番号のリスト
  2. すべての高校のリスト
  3. すべてのスケジュールのリスト
  4. 会議のリスト
  5. 今年の各プレーヤーの統計 (ポイント、リバウンド、スティール、プレイしたゲームなど)。

統計は私のファクト テーブルであり、残りは私の暗いテーブルであると仮定します。

今、百万ドルの質問 - 一体どのようにしてデータをそのフォーマットに適切に変換するのでしょうか?

それらをそれぞれのテーブルに単純にインポートしようとしましたが、それらがどのように接続されているかわかりません。

例: 800 人のプレーヤーと 400 の学校があります。各学校には一意の ID (主キー) があります。プレイヤーを薄暗いプレイヤーにアップロードし、学校を薄暗い学校にアップロードします。では、それらをどのように接続すればよいでしょうか。

助けてください。前もって感謝します。とりとめのない申し訳ありません:)

4

4 に答える 4

1

ETL ツール (E- ソースからデータを抽出する、T- データを変換するか、必要に応じて操作する、L - DW にデータをロードする) を使用すると、安全かつ確実にデータを DW にロードできます。

SSIS、TalendなどのETLツールを使用できます。

于 2016-11-02T08:23:14.333 に答える
0

はい、「スター」、「ディム」、「ファクト」、「データ ウェアハウス」は適切な用語ですが、「エンティティ」と「関係」からアプローチしたいと思います...

基本的に 5 つの「エンティティ」を定義しました。各エンティティは (通常) 1 つのデータベース テーブルとして表されます。を書きますCREATE TABLEsPRIMARY KEYfor eachを必ず含めてください。テーブル内の各行を一意に識別します。

次に、関係について考えてみましょう。1 つの高校には「多くの」選手がいるなど、1 対多について考えてみましょう。多くのことを考えてください。

1 対多の場合、たとえば、id高校の をplayer表の列として入力します。

many:many の場合、追加の tableが必要です。CREATE TABLEsあなたが必要とするかもしれないそれらのいずれかのために書いてください。

次に、データを読み取り、INSERTs適切なテーブルに入力します。

その後、SELECTs興味深いデータを抽出する方法について考えることができます。同時に、何INDEX(es)が役立つかを決定します。しかし、それは別の議論です。

すべてを終えると、SQL について多くのことを学び、いくつかのことを別の方法で行うべきだったことに気付くかもしれません。だから、最初からやり直す準備をしてください。それを学習演習と考えてください。

于 2016-11-05T19:24:32.033 に答える