私は現在、SaaS 準リアルタイム分析アプリケーション用に Redshift をテストしています。クエリのパフォーマンスは、1 億行のデータセットで問題ありません。
ただし、より多くのユーザーが同時にアプリケーションを使用する場合、クラスターあたり 15 クエリの同時実行制限が問題になります。
各クエリ (アドホック クエリ) でフィルターをカスタマイズする権限があるため、すべての集計結果をキャッシュすることはできません。
アプリケーションの要件は次のとおりです。
- クエリは 10 秒以内に結果を返す必要があります
- 100 列を超えるフィルターを使用したアドホック クエリ
- アプリケーションで同時に接続する 1 ~ 50 のクライアント
- 1,000 万行/日の割合で増加するデータセット
- 典型的なクエリは、集計関数 COUNT を使用した SELECT、1 つまたは 2 つの結合を使用した AVG です。
Redshift はこのユース ケースに適していませんか? これらの要件に対して、他にどのようなテクノロジを検討しますか?