問題タブ [rolap]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ssas - 表形式のメモリ内 vs 多次元および molap モード
ssas-models 表形式および多次元キューブについて質問があります。両方のモデルがリアルタイム モード (ダイレクト クエリ モードとロールラップ) で機能することを読みました。
私の質問は、in-memory-cache-mode の表形式モデルと molap-mode の多次元モデルに関するものです。そこにあるデータはどのくらい最近のものですか?データが更新される頻度や更新方法を自分で定義できますか?
前もって感謝します!
mdx - mondrian での集合計算の最適化
MDX クエリがあり、Mondrian エンジンで実行しています。
実行すると、タイムアウトのために失敗します。
しかし、私が実行すると、
カラムにセットするだけで、3 分で正常に実行されます。
最初のクエリの SQL ログを調べたところ、セット「ClaimantSet」のタプルごとに ICD9Desc 値が計算されていることがわかりました。つまり、セット claimantSet に 300 タプルがある場合、ICD9Desc は 300 回計算され、300 SQL クエリ発生しています。そして、このため、時間とタイムアウトがかかります。
SQL クエリが何度も生成されないようにする解決策はありますか? Mondrian で MDX クエリまたはスキーマを最適化できますか?
ssas - データを SSAS 次元表現からリレーショナル表現に変換する方法はありますか?
SSAS OLAP キューブをリバース エンジニアリングして元のリレーショナル表現に戻す方法があるかどうか、私はさまよっていました。そのようなことは可能ですか?
database - ROLAP カラムナ データベース
非常に単純なユースケースがありますが、ニーズに合った最適な DB ソリューションを選択するのに苦労しています。
要件:
さまざまなプロパティ (数千) で数百万のレコードをクエリでき、1 つの主キーを保持できる OLAP DB。また、データのアップロード時に部分的に高速である必要があります。
ユースケース:
ユーザーデータベースがあり、すべてのユーザーは異なるプロパティに属しています。最大 10,000 のプロパティがありますが、ほとんどのユーザーのプロパティはそれぞれ 30 未満です。
表の例:
ユーザー/プロパティ
ユーザー1/1,5,10
user2/7,5,9,24,42,1090
ユーザー3/9
ユーザー4/98,1049,2000
. .
理想的なシナリオは、すべてのプロパティが列であり、データベースで 10,000 を超えるプロパティを許可する列型ストア データベースを使用することです。
Monetdb は私たちにぴったりですが、非常に重大な欠点が 2 つあります。
- バルク ロードは非常に低く、テストでは、アップロードされたレコードごとに 5 ミリ秒でした。100 万件のレコードをアップロードするには 1 時間以上かかり、非常に時間がかかります。
- 重複する主キーで一括読み込みが失敗します (その「重複するキー」のプロパティ値を更新したいのですが、このデータベースでは不可能です)。
ドルイドについても考えていましたが、より「イベント」主導です。すべてのプロパティが追加されたときのタイムスタンプが必要です。除外されたわけではありませんが、私たちが必要としているものに完全に適合するわけではありません.
必要に応じてさらに説明を行うことができます。ガイダンスをいただければ幸いです。
ありがとう
postgresql - PostgreSQL DB を XMLA データソースとして使用するには?
基本:
- 通常データとレポート データを含む PostgreSQL データベース
- ここからモンドリアンのzipをダウンロードしました
- クライアント ピボット グリッド コンポーネント ( DevExtreme Web )があります。
これまでのところ、MDX クエリと SQL データベース間のコネクタとして機能する OLAP サーバーを使用して、XMLA をデータソースとして提供する必要があります。そのため、Mondrian OLAP サーバーを使用したいと考えています。
質問:
ここで、Mondrian OLAP サーバーを起動し、それを PostgreSQL データベースに接続して、OLAP スキーマを提供する必要があります。
- Mondrian OLAP サーバーを起動するには?
- PostgreSQL データベースに接続する方法は?
- mondrian サーバーにスキーマを提供する方法は?
- そして最後に、モンドリアンサーバーに接続する方法は?
ステップバイステップガイドやモンドリアンの有用なドキュメントが見つかりません。それは私にとって大きな雲です。
pentaho - レポートの空のセル/オフセット: キューブでディメンションと階層を定義する方法は?
いくつかのプロセスのダイナミクスを分析したいと思います。そのために、Pentaho Business Intelligence Server CE 5.0.1 用の Saiku 分析プラグイン CE を使用します。
いくつかの集計を実行するために使用するファクトのテーブルとディメンションのテーブルがあります。ディメンションは、「年 - 月 - 日」の階層を表します。
年別と月別の 2 つのレポートを作成しました。レポートは次のようになります。
それが示すデータは正しいです:
独立したディメンション「月」を定義すると、レポートは正しく表示されます。
ただし、データはすでに正しくありません。
「月 - 年」の逆次元を追加しようとしましたが、データが表示されませんでした。
レポートに空のセルが含まれないディメンションを定義する方法はありますか?
etl - この多次元モデルで何が間違っている可能性がありますか?
リレーショナル データベース (ROLAP) でスター スキーマを使用して、単純な多次元データ モデルを構築したいと考えています。そのために、ファクト テーブルと 2 つのディメンション テーブルを作成します。まず、運用ソースからデータをコピーし、このデータを処理します (簡略化された ETL プロセス)。
date
私のモデルでは、との 2 つの次元のみstatus
です。測定: 特定のステータスの数 (一定時間)。
時間ディメンション テーブル:
tbl_application
時間範囲全体 (フィールド ) が格納されているテーブル -- がありますVersionDate
。したがって、私がこのように入力している時間ディメンション テーブル:
ステータス ディメンション テーブル: 既存のテーブル全体を使用しますtbl_applicationstatus
。
次に、ファクト テーブルを作成します。ディメンション テーブルとメジャーへの外部キーが含まれています。
transaction_id
- 集計するこのフィールド (ステータスの数)。
次に、ファクト テーブルとディメンション テーブルの間にリレーションシップを追加します。
次に、ファクト テーブルに次のように入力します。
OLAP サーバーとして Mondrian を使用しています。多次元データベースの論理モデルを定義するモンドリアン スキーマ:
OLAP クライアントとして、Saiku Analytics を使用しています。
基本的に、私は正しいデータを取得しますが、よくわかりません。たとえば、ファクト テーブルにデータを入力するために使用する方法は正しいでしょうか。ETL プロセスを適切に構築していますか? これはテスト モードであり、データ ウェアハウスと多次元モデルの構築でいくつかの実験を行っています。