“star-schema”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

1509 参照

sql-server - スタースキーマ構造 - 多次元へ

私はスタースキーマウェアハウス (MS SQL Server、MS Report Builder と OLAP を介してアクセス) を持っています。これには多くの小さなディメンションがあります。これは、ディメンションが 2 つの列 (ID と説明) から構築され、ファクトから数百がリンクされていることを意味します。テーブル。

これにより、このリターンに対する実際のカウントがない場合でも、ファクトからすべてのアイテムを提示するオプションが提供されます (null を表示)。ただし、これが可能な限り最良の方法でデータを表すとは確信していません。説明がファクトの一部である非正規化テーブルの場合、OLAP アプローチと並行して SQL を介してデータをクエリする機能が向上するためです。

多数の 1 レベルディメンションのこの構造は正常であり、適切な方法ですか? 正直なところ、空白が表示されると予想されるのは、時間や日付のディメンションなどに対するものだけですが、これらはデータから強制されてチャートやテーブルにギャップが生じる可能性があるため、実際にはそれほど問題ではないようです.

この構造が良いか悪いかについての見解 - 私はこれを変えたいと思っていますが、ベストプラクティスと歩調を合わせていない場合は、喜んで考え方を変えます.

構造の例 (これは 1 つの Fact テーブルの一部です)

ファクトテーブル - (プロパティ)

寸法表 -

これを言い換えると、ディメンションは実際にはファクトの個別の表である必要がありますか、それともファクトの一部としての説明を使用したほうがよいでしょうか? レポートを迅速かつ簡単にし、フィールドに値がない場合のレコードのドロップを最小限に抑えたいと考えています。

2014-12-29T14:21:03.853

0 投票する

2 に答える

198 参照

mysql - スタースキーマの集約の問題

次のように、2 つのディメンションテーブルと 1 つのファクトテーブルがあります。

結果を取得するためのクエリ:

上記のクエリの結果は 1,3,4 です

しかし、私は1,2,4を期待しています

どうすれば期待どおりの結果を達成できますか、または私の概念は間違っていますか?

mysql sql group-by aggregation star-schema

2014-12-31T21:56:16.670

0 投票する

1 に答える

39 参照

oracle - 次元モデルでOracle Materialzed Viewを使用する方法

日付で範囲分割された大きなファクトテーブル (数百万行) と分割されていない小さな次元テーブルを持つ次元モデルがあります。クエリのパフォーマンスを向上させるために、これらのシナリオでよく使用されるマテリアライズドビューに出会いました。

ここで、これらのマテリアライズドビューを利用して集計レポートを取得するには、次の 2 つの方法のどちらが優れているかを知りたいと思います。

A. ファクトテーブル全体を必要な各ディメンションテーブルと結合して、1 つを作成します。

これは、それらを使用する最も基本的な方法のようです。しかし、それはかなり制限されているようで、作成したいクエリのバリエーションごとに新しい具体化されたビューが必要になります。

B. ファクトテーブルの集計に対して作成し、ディメンションジョインバックを実行するときにクエリの書き換えを利用します。

ケース A で上記のように結合を行います。これは、ファクトテーブル全体ではなく、この集約されたマテリアライズドビューを結合に使用します。

それぞれのケースまたは他のケースをいつ使用するかを誰かに教えてもらえますか?

oracle oracle11g data-warehouse materialized-views star-schema

2015-01-11T04:58:04.450

0 投票する

1 に答える

125 参照

data-warehouse - ディメンションモデリング - さまざまなディメンションの複合キーで使用される共通の属性

私は今まで直面したことのない状況に直面しています。

サテライトロケールによって異なる、同じ ERP システムの複数のインスタンスがあります。各ロケールには独自の ID が割り当てられます。

各サテライトロケーション内で、DB スキーマは他のものと同じで、同じテーブル、同じ値です。

これらのロケールの 2 つ以上のテーブル、たとえばパーツを組み合わせる場合、それらの自然操作キーは同じになりますが、追加の属性データは異なる場合があります。また、パーツがどのサテライトロケールから来たかに基づいてパーツにリンクできるようにする必要があるため、ここで複合キー (パーツ ID とサテライト ID) が必要だと考えています。

これは、この 1 つのディメンションでは問題ありませんが、このサテライト ID は他の多くのディメンションでも同じように使用されます。また、多くのファクトテーブルの主要なスライサーでもあります。

この属性をどのように扱うべきですか? それを独自の次元に置き、スノーフレーク？または、値を各ディメンション (複製) にプッシュしますが、ファクトテーブルにサテライトディメンションへの唯一の FK を保持させますか?

data-warehouse dimensional-modeling star-schema snowflake-schema

2015-01-21T15:55:22.570

0 投票する

1 に答える

134 参照

data-warehouse - データウェアハウスのキー構造

ディメンションキーの構造に関する質問があります。私は古典的なスタースキーマを構築しています。したがって、ディメンションテーブルのすべてのエントリが独自の一意のキーを持つように、シーケンスを使用してディメンションキーを作成しています。ここまでは順調ですね。ここで、Oracle Warehousebuilder によって作成されたプロジェクトによるキー構造を見てきました。このソフトウェアは、ディメンションキーに加えて、ディメンションの階層のすべてのレベルで専用のキーを定義します。次の例のようになります。

それは本当に必要ですか？そうでない場合、このアプローチの利点や一連の考え方は何ですか?

data-warehouse dimension star-schema

2015-01-29T10:44:25.717

0 投票する

1 に答える

2591 参照

pentaho - 階層とレベル (Pentaho スキーマワークベンチ)?

私は BI の世界に足を踏み入れたばかりで、たくさんの質問があります。BI の在宅ワークプロジェクトを行う必要があるため、以下を使用することにしました。

MYSQL (データベース)
ペンタホケトル (ETL)
Pentaho スキーマワークベンチ (スタースキーマ)
QlikView (レポート)

SUPERMARKETスキーマワークベンチとMySQLデータベース間の接続から編集されたディメンションテーブルがあります:

テーブルSUPERMARKET (id_supermarket, name_supermarket, number_of_boxes, active (YES or NOT), date_of_update)
SUPERMARKETテーブルは、外部キーによって Fact テーブルに直接関連付けられますSALES。

私の質問は、SUPERMARKET ディメンションで階層とレベルを確立する方法です。

私が知っているのは、次元テーブルのすべてのメンバーは、時間次元のようにそれらの間に関係を持たなければならないということです (年は四半期を含み、四半期は月を含み、月は週を含み、週は日を含みます)。

もう 1 つ質問があります。Pentaho ワークベンチはスタースキーマを XML ファイルとしてエクスポートしますが、ETL 用に Pentaho Kettle でこのスキーマを呼び出したり使用したりするにはどうすればよいですか?

pentaho kettle star-schema

2015-02-08T12:39:41.387

0 投票する

1 に答える

420 参照

oracle - 9999 年を含むファクトテーブルの作成

私は、顧客のステータスに基づいて、オラクルで単純なファクトテーブルを構築しています。顧客には「アクティブ」と「紛失」というステータスがあり、そのステータスで開始した日付と終了した日付があります。

サンプルの 3 行は次のようになります。

ここでは、cust 1 がアクティブでしたが、失われました。アカウントのステータスが現在 (今日の時点) の場合、終了日の列は 31/12/9999 です。Cust 2 は現在アクティブです

私の質問は、どうすればこれをファクトテーブルに入れることができるでしょうか。

ファクトテーブル:

そしてそれをテストします。

オラクルに9999年を認識させることができないようです

oracle schema data-warehouse star-schema

2015-02-13T02:32:48.133

0 投票する

0 に答える

230 参照

sql-server - マルチカラムビジネスキールックアップでファクトテーブルを埋める

Stack Overflow と Google で検索を行ってきましたが、私の質問に対する答えが見つかりませんでした。

「ゼロから」のデータウェアハウスプロジェクトを行ってから 1 分が経過したので、過去の知識の一部を払いのけつつ、データロードシナリオの 1 つに対する解決策を検討中です。

もちろん、多くのディメンションが結合されたファクトテーブル (factOrderLines) を作成しています。factOrderLines にリンクしたいディメンションの 1 つは、dimItem です。問題は、アイテムのベンダーとベンダーの部品番号、製造元と製造元の部品番号、または ManagedItems (MngItemID) と呼ばれるアイテムのサブセットからの識別子のいずれかに基づいてアイテムが一意であることです。

ソース例:

問題は、ソーステーブルから dimItem テーブルに結合して、factOrderLines テーブルにデータを入力するときに、3 つのルックアップシナリオがあることです。これにより、数値が膨らみ、パフォーマンスが低下しています。

このシナリオに対して、私が実装し始めたものよりも効率的で優れたアプローチはありますか?

編集: 完全な INSERT クエリ (理解を深めるため)

sql-server data-warehouse star-schema fact-table

2015-03-04T16:15:00.263

問題タブ [star-schema]

Reference