スター スキーマ データ ウェアハウスに基づいて OLAP キューブのおおよそのサイズを取得するために使用する方法を知っている人はいますか? ディメンションの数、ディメンション テーブル内のレコードの数、ファクト レコードの数、そして最後に集計または個別のレコードの数などに基づくもの.
私が見ているデータベースには、200 億行を超えるファクト テーブルと、2000 万行、7000 万行、13 億行のいくつかのディメンション テーブルがあります。
ありがとうニコラス
スター スキーマ データ ウェアハウスに基づいて OLAP キューブのおおよそのサイズを取得するために使用する方法を知っている人はいますか? ディメンションの数、ディメンション テーブル内のレコードの数、ファクト レコードの数、そして最後に集計または個別のレコードの数などに基づくもの.
私が見ているデータベースには、200 億行を超えるファクト テーブルと、2000 万行、7000 万行、13 億行のいくつかのディメンション テーブルがあります。
ありがとうニコラス
この見積もりを作成する上でのいくつかの障害がわかります。ディメンションテーブルの行数とカーディナリティを個別に知ることは、それらの間の関係ほど重要ではありません。
それぞれ固有の値nを持つ2つの低カーディナリティ次元を想像してみてください。mこれらのディメンションでOLAP集計をキャッシュすると、関係が純粋な全単射にどれだけ似ているかに応じて、値からn + m値までのどこでも生成されます。n * mあなたが提供した情報だけを考えると、あなたが言うことができるのは、あなたが3.64 * 10^34値よりも少なくなることになるということだけです、それはあまり役に立ちません。
私は悲観的ですが、キューブを生成して完了時に計量するのは意味がないほど高速なアルゴリズムがあります。
関連性があると思われる研究論文を書きました。
KamelAouicheとDanielLemire、OLAPにおける5つの確率的ビューサイズ推定手法の比較、DOLAP 2007、pp。17-24、2007。http: //arxiv.org/abs/cs.DB/0703058
良い。リレーショナル データベースに格納されている同じデータの約 1/4 から 1/3 のサイズである Analysis Services データの一般的なルールを使用できます。
エドワード。