2

伸縮自在の大容量ストレージ
用に、マルチノード コンピュータ ネットワーク (Linux PC の内部サブネット) にまたがる B+tree を構築したいと考えています。
範囲スキャンは重要です。

これは基本的に
分散 DB システムの基礎となるデータ構造ですか? (カサンドラ、HBase)

分散 B+Tree に関する研究はありますか? http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf
で記事を見ましたが、 BTree をスキップして障害のあるノードを削除するだけです (データが失われます) 。

冗長性が組み込まれた B+Tree に特に関心があります
(つまり、ホストに障害が発生し、そのホストがホストするすべてのノードがオフラインに
なった場合、複製された別のホストがプライマリ ノード
サーバーになり、障害が発生したホストの代わりになることを望みます)。 )

DB インスタンスのコレクション (1 ノード、1 DB) を使用したくありません。
シャーディングは
大規模なストレージ システム (
FOSS OS を備えたコモディティ x86、x64 ハードウェア全体) には適していないためです。

車輪の再発明ですか?
Cassandra または HBase を使用する必要がありますか?

4

1 に答える 1

1

Cassandra は範囲クエリをサポートしています。

Google のBig Tableは、マシンの電源を入れると、自動的に新しいマシンをクラスターに追加します。非常に弾力性があり、マシンを簡単に追加できます。残念ながら、その速度には欠点があります。クエリは非常に制限されています。いくつかの範囲クエリを実行できます。リストと詳細については、次の記事を参照してください: http://geothought.blogspot.com/2009/04/google-app-engine-and-bigtable-very.html

Big Table にデータを格納する方法の良い例: http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable

素晴らしいスタック オーバーフローの投稿: bigtable 派生物に大量の順序付けられた時系列データを保存する

于 2011-12-17T02:12:13.297 に答える