filesystems - 多数のファイル用の分散ストレージ

Question

ここで小さなブレーンストーミングを行います。

分散ストレージソリューションに最適なソリューションを検索します。私は効率的なキー/値ストレージ、フラットな名前空間、最小限のレイテンシーを探しています。

シナリオ

1Ko 以下の小さなブロブレコードを保存する予定です。それらは主に生成/消費されたレコードです。

ただし、一部のレコードは 10Mb まで大きくなる場合があります。これは最大ですが、可能でなければなりません。

データはディスク上でシリアル化する必要があります。

私の最初の優先事項は、ファイルの非常に巨大なリストに対して優れた応答時間を提供できるストレージであり、数億になる場合があります。

もちろん、この数では、ファイルを繰り返し処理することは気にしません (機能を探しますが、パフォーマンスは気にしません。デバッグまたはメンテナンスのためだけです)。

そしてもちろん、SPOF を使用せずに拡張できるソリューションは、より優れたものです。

Linux ソリューションである必要があり、クラウドは許可されていません (プライベートデータ)。

Voldemort、Cassandra、およびHBaseを見ました。

LustreとCephもチェックしますが、キー/値ストアではありません。

CouchBaseとMongoDBは、永続性を有効にするとひどいパフォーマンスを示します。

いくつかのテストを実行していますが、まだ堅実なベンチマークを開始できません。誰かがこのソリューションに関する情報を持っているか、そのようなワークロード用の別の製品設計を知っていますか?