問題タブ [datamart]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
foreign-keys - データマートの代理キー
3 つのファクト テーブルに 32 のディメンションがあり、現在 SQL Server 2012 に取り組んでいます。
SQL Server の外部キーはインデックスごとに 16 個に制限されているため、代理キーを使用してファクト テーブル内のデータにインデックスを付ける必要があるということですか?! または、この問題の別の解決策はありますか?
私の ETL は毎月実行されるため、挿入するデータ (外部キーの連結) がまだ存在しないことをすべてのデータポンピングの前にチェックする必要がありますか?!
代理キーを使用することに決め、モンドリアン キューブ (ペンタホ) を使用している場合、作業方法 (スキーマの作成) は同じですか、それとも通常の方法とは異なりますか?
ありがとうございました。
database-design - データマートを使用してデータ ウェアハウスを作成する方法
私は本当に助けが必要です、私の状況は次のとおりです: - データ マートがあり、そこからデータ ウェアハウスを作成する必要がある - トランザクション DB から開始する DWH を作成する方法しか知らない - ETL - データ ウェアハウス - データマート - 何をすべきかわからないリバーシブルアクションについて行います。DM - データ ウェアハウス - MSSQL、ビジュアル スタジオを使用しています - どうすればよいですか? すべてのデータマートをデータ ウェアハウスにマージし、冗長性を手動で削除するだけですか?
oracle - ファクト テーブル - 異なるものを選択しますか?
私のストレージ データ モデルでは、次の関係が得られました。
root_tbl -- 1:n -- entry_tbl -- n:1 -- action_tbl
他にもいくつかのテーブルがありますが、これで基本をカバーできます。基本的に、ルート テーブルの 1 つの ID には、エントリ テーブルに複数のデータセットがあります。
サンプルデータ:
ここまでは順調です...このデータモデルを使用すると、アクション「10」で国として「英国」を含むレコードの数などを簡単に答えることができます。このデータをファクト テーブルに入れたいのですが、問題はこれら 3 つのテーブルの関係です。たとえば、国、ユーザー、または製品をカウントするたびに ID で個別の選択を行う必要があるよりも、entry_tbl のレコードをファクトとして使用します。
ファクト テーブルは多かれ少なかれ次のようになります (文字列を外部キーとして想像してください)。
これは、冗長なデータがたくさんあることを意味します。
これらの解決策を回避する方法はありますか? ファクト テーブルには、300 ~ 500m の行が含まれます。
あなたが私の主張を理解してくれることを願っています。不明な点があればお気軽にお尋ねください
よろしくトーマス
java - Java プログラムから実行されているシェル スクリプトから出力を取得できません
Java プログラムからシェル スクリプトを実行しています。そのシェル スクリプトで、データマート サーバーに接続して resmgr コマンドを実行していますが、resmgr コマンドの出力を取得できません。コマンド ラインから同じコマンドを実行すると、取得できます。出力を取得します。
シェル スクリプト:
Java プログラム:
database - 要約してはいけないデータを持つデータマート
次の問題があるデータマート テーブルをどのように構築できますか。
ディメンション テーブル:
人。
時間 (時、分、日、週)。
ファクト テーブル:
group_of_indicators
問題は、ある人から 1 週間で情報を取得したい場合、この情報の取得方法が異なるため、毎日を追加できないことです。つまり、情報は要約できません。
特定の時間内のすべてのユーザーと同様に、グループ情報の取得方法が異なるため、各ユーザーを追加してインジケーターを取得することはできません。
これらの制限のあるデータマートを設計することは可能ですか? 答えが「はい」の場合、どのように?.
前もって感謝します
data-modeling - 累積スナップショット テーブルに複数の日付を含めることはできますか?
次元モデリングの意味を理解しようとしています。ディメンション モデリングの本を読みながら、スター スキーマを作成しました。
ファクト テーブルは累積スナップショット テーブルであり、代理キーを使用して日付ディメンションにリンクされた複数の日付列があります。
このスタースキーマを作成しようとしている明確に定義されたプロセスがあります。レポートや活動レポートのような目標到達プロセスを準備する必要があるため、この各ステップのファクト テーブルに日付フィールドがあります。だから質問は本当に
これは正しいです?ファクト テーブルは同じ日付ディメンション テーブルを複数回参照できますか?
私がインターネット上で見ている例は、これが正しいことを示しているようですが、Pentaho レポートで機能させるのに苦労しています。そのため、設計上の問題なのか、Pentahoで正しく行っていないのかはわかりません
mysql - データマート スター スキーマ開発ソリューション
DB を DM に変換する必要がありますが、これが DB スキーマであることに疑問があります。
http://i.stack.imgur.com/PHha1.png
これは、著者、本、およびその他のさまざまなものを格納する単純な DB です (著者テーブルの外部キーは間違いであり、年と呼ばれる別のフィールドとしてのテーブル「本」)。著者が何年にもわたってどのように働いているかを分析するための DM を作成する必要があります (共著者と本)。著者の引用を見る方法さえ追加したいと思います...私が構築しているDMは次のようなものです:
http://i.stack.imgur.com/MPCTL.png
今、私の疑問は次のとおりです。このデータマートに引用を追加するにはどうすればよいですか?
引用のためのPS私は著者を引用している本を意味し、私はケトルとペンタオを扱っています
hadoop - rdbms とビッグデータをデータマートに?
反対側に RDBMS (SQL Server/Oracle) と Hadoop データベースがあります。主キー 'customer' は両方のデータ ストアで共通です。
いくつかの質問:
- RDBMS とビッグ データの両方からデータを取得し、レポートを作成できるデータマートを持つことは可能ですか? ツールの例は何ですか?
- データマート自体は RDBMS ストアである必要がありますか、それともメモリ内のものにすることができますか?
- この環境でデータ分析を実行する最善の方法は何ですか?
- データの視覚化についてはどうですか?
それとも、すべてのデータを RDBMS データ ウェアハウスに取り込んでから、これらの問題を解決する必要がありますか?