私は SSAS を初めて使用するので、多次元 OLAP キューブに関する記事を読み、キューブの概念を理解するのに苦労しています。「キューブ」という用語は 3 つの次元を示唆していますが、キューブには最大 64 の次元を含めることができます。立方体でこれがどのように可能であるかを説明していただけますか (3 次元の例の x、y、z 平面以外)? 研究へのリンクだけを提供するのではなく、何らかの説明を期待してください。
2 に答える
DW の世界では、「次元」という言葉は過負荷であり、文脈によって意味が変わります。ここに例があります。
- ある日に、顧客が店に足を踏み入れ、製品を購入します。
この例には、4 つのディメンション (日付、顧客、店舗、製品) と 1 つの事実 (売上) があります。したがって、典型的なキンボールスターは次のようになります。
ディメンション (テーブル) は、めったに変更されないオブジェクトのプロパティのルックアップ テーブルです。製品、顧客、および店舗は、一部のプロパティ (属性) を変更する場合がありますが、めったに変更しません。ファクト テーブルは、これらのオブジェクト間の相互作用をキャプチャします。次元、日付、店舗、製品、および顧客の交点にメジャー SalesAmount
があります。日付別、年別、製品別、ブランド別、都市別、国別、年齢層別など、あらゆる方法で売上高を簡単に集計 (合計) できることに注意してください。これはそもそものアイデアでした。
立方体を 3 次元構造と考えないでください (名前にもかかわらず)。データ ウェアハウスの状況における "ディメンション" は、ウェアハウス内のデータにアクセスするために使用できる単純な可変値です。それらは重要な部分と考えることができますが、個別に、または組み合わせて非常に簡単にアクセスできる部分です (従来のテーブルの主キーとは異なります)。
たとえば、顧客データと販売データを保持するために、倉庫に次のディメンションがあるとします。
- 顧客ID。
- 州 (場所)。
- 年。
- 月。
- 日。
そのレイアウト (5 次元の「スーパー ハイパー キューブ」) を使用すると、州の境界を越え、年間を通じて (さらには月のさまざまな時期に) さまざまな購入パターンを持つ可能性がある顧客に対して、クエリを簡単に実行できます。
これらの主要部分はすべて、特定の顧客の特定の場所の特定の年の特定の月の特定の日付の単一の売上高を指すだけです。
そのデータにアクセスする方法の例。すべての顧客の購入パターンが月単位でどのように変化したかを、すべての年の平均で確認したいとします。これを行うと、1 年の特定の時期に最も多くの収益を上げた顧客を確認できます。たとえば、それより前の 1 か月程度に広告のターゲットを絞ることができます。
顧客 ID と月を使用して情報を抽出し、州、年、および日付のディメンションを効果的に「折りたたむ」 (つまり、これらの 3 つのディメンションの売上高を合計して、2 次元の結果、顧客、顧客を取得します)。対月)。