そのため、2 種類のインデックスを格納しようとしています。
- 第 1 の種類は、1 から 1000 の間の値を持ち、それぞれが 1 つまたは 2 つの 64 ビット整数である、10 億のオーダーになります。
- 2 番目の種類は数百万のオーダーで、それぞれ約 200 の値があり、各値のサイズは 1KB から 1MB です。
使用パターンは次のようになります。
- どちらの種類のインデックスにも、1 秒あたり最大数千回まで値が追加されます。
- インデックスはめったに読み込まれませんが、読み込まれるときはインデックス全体が読み込まれます
- インデックスに値を書き込むとき、またはある種のバッチ タイプのジョブで、インデックスをプルーニングする必要があります。
これまでかなりの数のデータベースを検討してきましたが、現時点でのお気に入りは Cassandra と PostreSQL です。ただし、私たちのアプリケーションは Erlang にあり、Cassandra のプロダクション対応バインディングはありません。そして、大きな要件は、維持するために多くの人員を必要としないことです。Cassandra では予期しないスケーリングの問題が発生するのに対し、PostgreSQL では単にシャード処理が面倒になるような気がしますが、少なくとも私たちにとっては既知の量です。私たちはすでに PostgreSQL に精通していますが、Cassandra にはあまり詳しくありません。
そう。このユース ケースに最も適したデータ ストアに関する提案や推奨事項はありますか? 私はあらゆる提案を受け入れます!
ありがとう、
-アレック