MOLAPとは対照的に、ROLAPキューブを設計する際に考慮すべき事項のリストを提供するリソースを誰かが持っていますか(私はPentahoでやっていますが、原則は他の実装と似ていないと思います)。たとえば、次のようなことを考えています。
キューブをクエリするときの計算作業を減らすために、ETL ステージで追加の変換作業を行う必要がありますか?
すべてのディメンション テーブルをキューブと同じデータベースに配置する必要がありますか?
MOLAPとは対照的に、ROLAPキューブを設計する際に考慮すべき事項のリストを提供するリソースを誰かが持っていますか(私はPentahoでやっていますが、原則は他の実装と似ていないと思います)。たとえば、次のようなことを考えています。
キューブをクエリするときの計算作業を減らすために、ETL ステージで追加の変換作業を行う必要がありますか?
すべてのディメンション テーブルをキューブと同じデータベースに配置する必要がありますか?
まず、設計は似ていますが、パフォーマンスとスケーラビリティの戦略が異なります。
次に、etl プロセスはほとんど同じです。例外 - 通常、リレーショナル データベースのスケーラビリティ機能により、rolap キューブには molap キューブよりも多くのデータが表示されます。また、Rolapをサポートするだけでなく、Rolap 以外のデータベース (ウェアハウス、さらにはトランザクション データベース) 内の Rolap キューブもよく見かけます。
最後に、通常、データ量が多い場合は集計テーブルを生成します。その集計はさまざまな方法で行うことができますが、別の非同期プロセスを管理する能力がないか、期間集計ジョブを実行するのが非現実的なデータ量がある場合を除き、通常、ETL プロセスによって駆動されることはないと思います。
私はインドネシアで Pentaho を実装しています。まず、もちろん、関連する代理キーによってすべてのメジャー グループを集計する必要があります。
また、Mondrian では、追加の集計テーブルを使用して一部の計算を「キャッシュ」できます。Pentaho Aggregate Designer で実行できます。ただし、その後、データ ウェアハウス / ETL ステージで追加の作業が必要になります。
よろしく、
フェリス
リンクと情報を提供してくれた Feris に感謝しますが、最終的には次の本を選びました。
Mondrianのサイトとドキュメントをよく見ましたが、本の方がより包括的です。