問題タブ [datamart]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
data-warehouse - データ ウェアハウスの原則と NoSQL
MongoDB、CouchDB、および関連するテクノロジーを使用すると、クエリを高速化できますが、これはまだ有効ですか?
「クエリと分析のために特別に再構築されたトランザクション データのコピー。」(R. Kimball データ ウェアハウス ツールキット、1996 年
つまり、分析目的でクエリを実行するために、データを OLAP スキームに再構築する必要があるのでしょうか。より具体的には、ドリルダウン、スライス アンド ダイス、およびその他の分析目的のレポートを NoSQL で実現できますか (必ずしも OLAP モデリングを使用する必要はありません)? また、OLAP の「データ サブセット」クエリ制限を克服し、NoSQL を使用してデータ ユニバース全体をレポートできるでしょうか?
data-warehouse - "カウント" メジャーをファクト テーブルに格納する必要がありますか?
特定のサービスの「待ち時間」を含むファクト テーブルがあります。さまざまなスライスに基づいて待機時間を説明できるディメンションがたくさんあります。ただし、同じディメンションのフィルターを介してサービスにアクセスした人数 (カウント) も知りたいと考えています。
時間単位の待ち時間とサービスを受けた人数の次元がまったく同じであることを考えると、同じファクト テーブルに保持するのがベスト プラクティスだと思います。私の質問は:
- 言及されたカウント メジャーに対して別のファクト テーブルが存在する必要がありますか?
- この測定値をどのように含めますか? すべての行に 1 を入れるだけですか? 待機時間に関係なく、サービスを一度しか受けていないためです (私のシナリオでは、1 を上回ったり下回ったりすることはできません)。
data-warehouse - Datamart と Datawarehousing を使用する場合
私は DW が初めてです。Datamart という用語を使用する必要がある場合と、Datawarehousing という用語を使用する必要がある場合。あなた自身の例、またはAdventureworksの観点から例を挙げて説明してください。
database-design - スタースキーマのモデル化の難しさ
まず、タイトルについて申し訳ありません.
学校に関連するリソースの量を測定するファクト テーブルを作成しています。
学校の数
学生
の数 従業員
の数 コンピュータの数(管理用および学生用)
FACT_SCHOOL_RESOURCES
School (FK)
Location (FK)
Education Type (FK)
Total_Schools*
Total_Students
Total_Employees
Total_Students_Computers
Total_Administration_Computers
*学校の数では、すべての行が同じ値 (1) になります。
私の問題は、学校に関連する「インフラストラクチャ」の問題がいくつかあることです。これは、複数のタイプ (エネルギー源、水源) があるため、実際にはその属性の 1 つ (「インフラストラクチャー」という名前の属性) に入れることはできません。 、Waste Disposal...) であり、各タイプを属性として使用することはできません。これは、各タイプについて、学校のディメンションと多対多の関係があるためです。たとえば、次のようになります。
電源
ソーラー パネル
発電機
都市エネルギー供給
...
廃棄物処理
埋め立て
焼却
リサイクル
堆肥化
廃棄物をエネルギーに
...
これらの例を使用すると、学校は廃棄物処理として埋め立てとリサイクルの両方を行うか、市のエネルギー供給を利用し、同時に発電機またはソーラー パネルを利用することができます。
これらの問題のいくつか(および私が言及しなかった他の多くの問題)が「教育の質」に関連していることを研究が示しており、それをすべて分析する方法があるはずであるため、これらすべてが必要です.
スター スキーマでこの問題を解決する最善の方法は何でしょうか? 出来ますか?
export - 特定のデータ マートからテーブル データをエクスポートしますか?
Sybase を使用してデータ ウェアハウス内のすべてのデータ マートからすべてのテーブルのリストを取得するには、次を使用します。
ただし、特定のデータ マート ("DM") からすべてのテーブルを取得してエクスポートしたいと考えています。私は Sybase に比較的慣れていないので、次の行に沿って何かを行うように直感的に指示されています。
それは明らかに機能していません。そうでなければ、私はここにいません:)。誰かが私を正しい方向に向けることができますか?
pentaho - ファクト テーブルに Pentaho Kettle を追加する方法
PDI を使用して多数の列を含む csv ファイルから、SQL Server で設計および実装したデータ マートにデータをロードしたいのですが、ディメンションの外部キーをファクト テーブルにロードする方法がわかりません。目標を達成する方法を教えてください。
これが私のデータ マートのスター スキーマです。
生データを含む csv ファイルは、主キーを除くディメンションのすべての列で構成され、fact : handling_time に含まれる列も csv ファイルに存在します。
pentaho - PDI のファクト テーブルへのテクニカル キーの取得
Pentaho Kettle のディメンションからファクト テーブルへのテクニカル キーを取得するにはどうすればよいですか。まだロードされていない新しいものだけです。
これは私のスキーマです:
csv ファイルからディメンションを直接ロードする変換と、これらの変換を並行して実行するジョブを既に作成しています。