用語はいたるところで使用されており、明確な定義を知りません。私は、データマートが何であるかを知っていると確信しています。また、Business Objects や Cognos などのツールを使用してレポート キューブを作成しました。
また、データマートは単なるキューブの集まり以上のものであると言う人もいます。
また、データマートはレポート キューブであり、それ以上のものではないと言う人もいます。
あなたが理解している違いは何ですか?
用語はいたるところで使用されており、明確な定義を知りません。私は、データマートが何であるかを知っていると確信しています。また、Business Objects や Cognos などのツールを使用してレポート キューブを作成しました。
また、データマートは単なるキューブの集まり以上のものであると言う人もいます。
また、データマートはレポート キューブであり、それ以上のものではないと言う人もいます。
あなたが理解している違いは何ですか?
キューブは、非常に具体的なものを意味する可能性があります(そして間違いなくそうすべきです) 。MSAnalysisServicesやOracle(旧姓Hyperion)EssbaseなどのOLAPサーバーを介して提示されるOLAPアーティファクトです。ただし、それはまた、はるかに緩く使用されます。この種のOLAPキューブは、標準のリレーショナルデータベースとは異なるAPIを使用するキューブ対応のクエリツールを使用します。通常、OLAPサーバーは独自の最適化されたデータ構造(MOLAPと呼ばれます)を維持しますが、リレーショナルデータソース( ROLAPと呼ばれる)のフロントエンドとして、またはさまざまなハイブリッドモード(HOLAPと呼ばれる)で実装できます。
具体的には、「cube」を使用して、SSASなどのOLAPサーバー上のキューブを参照します。
Business Objectsは、1つ以上のソース(リレーショナルデータベース、OLAPキューブ、フラットファイルなど)を介してデータをクエリし、インタラクティブなスライスアンドダイスアクティビティをサポートするために使用するMicroCubeと呼ばれるメモリ内データ構造を作成することで機能します。Analysis ServicesとMSQueryは、ASクライアントソフトウェアまたはExcelで開いて、同様の方法でスライスおよびダイシングできるキューブ(.cub)ファイルを作成できます。IIRC最近のバージョンのBusinessObjectsでも、.cubファイルを開くことができます。
衒学者になるために、Business Objectsは、ProClarityなどの真のOLAPシステムと、 Report Builder、Oracle Discoverer、Brioなどのアドホックレポートツールの間の「半構造化レポート」スペースにあると思います。クエリパネルへのラウンドトリップは、純粋な思考の流れのOLAPツールとしてはやや不格好になりますが、従来のレポートにはないレベルの対話性を提供します。Business Objectsのスイートスポットは、SQLに必ずしも精通していないスタッフによるアドホックレポートと、データへのドリルダウンを可能にするインタラクティブな形式で配信されるスケジュールされたレポートの提供という2つの場所にあると考えています。
「データマート」もかなり大まかに使用される用語であり、データウェアハウスシステムのユーザー向けのデータアクセスメディアを意味する場合があります。定義には、レポートツールとメタデータレイヤー、レポートレイヤーテーブル、またはキューブやその他の分析システムなどの他のアイテムが含まれる場合と含まれない場合があります。
私はデータマートを、特にデータウェアハウスアーキテクチャ全体の簡単に定義できるサブシステムである場合に、レポートが作成されるデータベースと考える傾向があります。ただし、特にエンドユーザーがデータに直接アクセスできるBusiness ObjectsやOLAPシステムなどのアドホックレポートツールがある場合は、ユーザー向けのレポートレイヤーと考えるのが非常に合理的です。
「データ マート」という用語はややあいまいになりましたが、伝統的に、組織の情報システムのサブジェクト指向のサブセットに関連付けられています。データ マートは、OLAP などの多次元テクノロジの存在を明示的に意味するものではありません。また、データ マートは、要約された数値データの存在を明示的に意味するものでもありません。
一方、キューブは、データが多次元命名法 (通常は OLAP テクノロジ) を使用して表示され、データが一般に複数の階層の交差として要約されることを意味する傾向があります。(つまり、家族の純資産と個人の純資産、およびその間のすべて) 一般に、「キューブ」は非常に具体的なものを意味しますが、「データ マート」はもう少し一般的な傾向があります。
OOP の話では、データ マートは「キューブを持っている」、「リレーショナル データベースを持っている」、気の利いたレポート インターフェイスを「持っている」などと正確に言うことができると思います。個々に「データマート」です。データマートという用語は、より包括的です。
データ マートは、特定のビジネス プロセスのデータの集まりです。データの保存方法は関係ありません。キューブは、行と列を持つテーブルとは異なり、多次元という特殊な方法でデータを格納します。Olap データベースのキューブは、従来のデータベースのテーブルのようなものです。データ マートにはテーブルまたはキューブを含めることができます。キューブは集計を事前に計算するため、分析を高速化します。
名前が示すように、キューブは構造化された多次元データ セットです (通常、それぞれがキューブの 3 つの側面を表す 3 つのディメンション)。データ マートは単なるコンテナーであり、それ自体は構造ではありませんが、ディメンションとファクトで (テーブルとして) フラットに編成されたデータ セットが含まれています。
キューブの構造により、キューブのさまざまな次元に沿ってデータを簡単に視覚化または概念化できます。したがって、ほとんどのビジネス アナリストまたは開発者は、キューブのクエリと操作が簡単であることに気付きます。
データ マートは、一連のテーブルを含むコンテナーにすぎないためです。ユーザーは、データのクエリと分析を行う前に、まず次元構造を概念化して理解する必要があります。
覚えて:
データ ウェアハウスは、データ分析を促進し、事実に基づくビジネス上の意思決定をサポートするために、レガシーおよびトランザクション データベース システムからデータを取得し、それをユーザー フレンドリーな形式で組織化された情報に変換するプロセスです。
データ ウェアハウスは、ソース データを抽出、クリーニング、適合、および次元データ ストアに配信し、意思決定のためにクエリと分析をサポートおよび実装するシステムです。
たとえば、KIMBALL は一貫して、データ マートを、アトミック データの基盤に基づく組織全体のデータのプロセス指向のサブセットとして定義してきました。これは、予想されるユーザーの質問ではなく、データ測定イベントの物理学のみに依存します。
正しい定義
誤った定義
私にとって、データマートは、データが比較的フラットで使用できない形式でダンプされる場所にすぎません。
キューブはそのデータを取得し、踊らせています。
私はマシューに同意します。「データ マート」という用語は、企業内のさまざまなアプリケーションで使用される一般的なデータとマッピングを格納するデータ ソースに対して使用する傾向があります。測定可能なデータはデータ マートに保存しないので、データ マートはキューブの複数のデータ ソースの 1 つと見なされます。しかし、これが私たちのやり方です。測定可能なデータをデータ マートに格納することを妨げるものは何もないと確信しています。