0

3 つのことを格納するデータベースの作成に取り組んでいます。実験、測定、メタデータとしましょう。メタデータは、変数の数とタイプの属性のセットで構成されているため、NoSQL の選択は魅力的です。

データベースに対して 2 つの単純なクエリが必要です。

1) Measure の特定の値を持つすべての実験のメタデータを教えてください。2) 実験のすべてのメジャーのメタデータを教えてください。

そして、私の主な要件は次のとおりです。

1) 大量のデータ。各 Experiment には、何百万もの可能なメジャー (そしてもちろんメタデータ) が含まれる可能性があり、何万分の 1 の Experiment があると予想しています。2) 並行性。任意の時点で 10 ~ 20 の実験を実行している可能性があり、何百万ものメジャーを同時に書き込みたいため、高速な同時読み取り/書き込みが必要です。

MongoDB を試してみましたが、書き込みロックのために遅いです。何とか早くしたいです。さらに、ここでは基本的に 2 つのインデックスが必要なため、クエリの 1 つをうまく処理できません。実験と対策を結節と考えて、それらを辺でつなぐのが自然だと思うので、代わりのTitanとして考えています。両方のクエリを高速に実行する方法を見つけることができれば、Hypertable も別の可能性と思われます。

非常に多くの noSQL データベースが存在するため、自分のニーズに合った適切なデータベースが見つからない可能性があります。提案?

4

1 に答える 1