0

収集したデータの分析を最終的に含む新しいサイドプロジェクトを計画しています。これは主に、さまざまな数のコンポーネントを含む時系列データです(リレーショナルデータベースの列を考えてみてください)。時系列データは、対象となる期間と測定される頻度によって異なります(したがって、より少ないテーブルに結合するための標準化された情報が多すぎることはありません)。時系列セットのいずれにもデータが多すぎることはありません。おそらく、シリーズごとに最大で約100,000の測定値があり、平均で約5000の測定値があります(行を考えてください)。少なくとも10,000の異なる時系列データのセットがあると思います(テーブルを考えてください)。

多くの複雑なクエリを実行する必要はないと思います(実行したとしても、このプロジェクトはバッチスタイルの分析であるため、DBからデータを選択した後、ソフトウェアで複雑な処理を実行できるため、時間に敏感なことは何もありません)そのため、MongoDBのようなNoSQLデータベースも検討しています。

MySQLとMongoDBのどちらがより良い選択であるかについて誰かが私にアドバイスできますか?MySQLの場合、どのストレージエンジンですか?どちらでもない場合、より良い提案がありますか?また、テーブルの数が10,000から500,000以上に急増した場合、それはあなたの答えを変えますか?

4

1 に答える 1

3

SciDB.orgという新しいDBMSを提案したいと思います。科学的な分析処理に重点を置いているため、一般的なDBMSではないと彼らは主張しています。時系列データ用に特別に最適化されており、クラウド上で実行するようにさらに最適化できます。

時系列データ用に最適化されています。これは、データを行ではなく列に格納するため、時系列での高速アクセスが可能になるためです。

あなたはそれをチェックする必要があります。

これを使用して、数か月にわたって毎秒2000サンプルでサンプリングされたデータを分析しました。

于 2012-09-21T19:50:00.080 に答える