私のシナリオで使用する NoSQL データベースまたはテクノロジ/ツールを教えていただけないでしょうか。SQL サーバー分析サービスに基づく OLAP キューブをオープン ソース テクノロジに置き換えることを検討しています。これは、データが大きすぎて管理できず、クエリが返されるのに時間がかかりすぎるためです。本のすべてのルールに従って、データを分割し、集計やパーティションなどを使用してキューブの設計を最適化しましたが、個別のカウント クエリの一部には 1 ~ 2 分かかります :( ファクト テーブルのデータ サイズはおよそ250GB. スター スキーマ方式で接続された 10 ~ 12 のディメンションがあります。
そのため、Hadoop/HBase/NoSQL データベースなどのオープン ソース テクノロジを試して、最小限のセットアップとオンボーディングで OLAP シナリオを解決できるかどうかを確認することにしました。
新しいテクノロジーに対する主な要件は次のとおりです。
個別のカウント クエリ (< 2 秒) に対して、非常に高速または瞬時に結果を取得する必要があります。
メジャーとディメンションの概念をサポートします (OLAP のように)。
- 多くの開発者が SQL の専門家であるため、SQL のようなクエリ言語をサポートします。
- Excel/Tableau を接続してデータを視覚化する機能。
今日のオープン ソースの世界には非常に多くの新しいテクノロジとツールが存在するため、正しい方向性を示していただけると幸いです。