Hadoop の Hive に対する多次元式 (MDX) のサポートはありますか?
3 に答える
OLAP ソリューションと Hadoop のデータを接続することが可能です。icCubeでは、独自のデータ ソースを作成できます (ドキュメントを確認してください)。Java インターフェイス (JDBC など) が必要です。
このソリューションは、データを OLAP サーバーにもたらします。処理を Hadoop に持ち込むことは別の問題であり、私の知る限り誰もそれを行っていません。事実を並行して集計することが可能です。もう 1 つのステップは、ノードにディメンションを設定することです。これは複雑な問題です (アルゴを並列バージョンに変換するのは簡単ではありません)。
MDX クエリを HiveQL に変換すると主張するSimba MDX プロバイダーがあります。これの機能と制限についてコメントするために自分で試したことはありません。
Mondrian (Pentaho Analysis Services)を使用できます。JDBC 経由で接続し、データベースに特定の方言を使用します。Hive 方言への言及を見たことがありますが、自分で試したことはありません。フォーラムを検索するのが最善です。
XML でキューブを定義するスキーマを作成する必要がありますが、幸いなことに GUI ツール (スキーマ ワークベンチ) が役立ちます。