伸縮自在の大容量ストレージ
用に、マルチノード コンピュータ ネットワーク (Linux PC の内部サブネット) にまたがる B+tree を構築したいと考えています。
範囲スキャンは重要です。
これは基本的に
分散 DB システムの基礎となるデータ構造ですか? (カサンドラ、HBase)
分散 B+Tree に関する研究はありますか? http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf
で記事を見ましたが、
BTree をスキップして障害のあるノードを削除するだけです (データが失われます) 。
冗長性が組み込まれた B+Tree に特に関心があります
(つまり、ホストに障害が発生し、そのホストがホストするすべてのノードがオフラインに
なった場合、複製された別のホストがプライマリ ノード
サーバーになり、障害が発生したホストの代わりになることを望みます)。 )
DB インスタンスのコレクション (1 ノード、1 DB) を使用したくありません。
シャーディングは
大規模なストレージ システム (
FOSS OS を備えたコモディティ x86、x64 ハードウェア全体) には適していないためです。
車輪の再発明ですか?
Cassandra または HBase を使用する必要がありますか?