テラバイト規模のデータ ボリュームを処理でき、可用性が高い (ファイブ ナイン) MySQL データベースを提供するためのソリューションを検討する必要があります。データベースの各行には、タイムスタンプと最大 30 個の浮動小数点値が含まれる可能性があります。予想されるワークロードは最大 2500 挿入/秒です。クエリの頻度は低くなる可能性がありますが、おそらく単一のテーブルのみを対象としますが、サイズが大きくなる可能性があります (100Gb のデータが含まれる可能性があります)。
MySQL Cluster が HA 製品であることを考慮して、私は MySQL Cluster を見てきました。データ量が多いため、ディスク ベースのストレージを利用する必要があります。現実的には、メモリに保持できるのはタイムスタンプだけで、他のすべてのデータはディスクに保存する必要があると思います。
この規模のデータベースで MySQL Cluster を使用した経験のある人はいますか? それは実行可能ですか?ディスクベースのストレージはパフォーマンスにどのように影響しますか?
また、この量のデータに必要な可用性を実現する方法について、他の提案も受け付けています。たとえば、標準の MySQL インスタンスのクラスタリングを処理するために、Sequoiaのようなサードパーティのライブラリを使用する方がよいでしょうか? または、MySQL レプリケーションに基づくより単純なソリューションですか?
唯一の条件は、MySQL ベースのソリューションである必要があるということです。私たちが扱っているデータに MySQL が最適な方法だとは思いませんが、それは難しい要件です。