database-design - スケーラブルなデータベースにツリー構造を実装する良い方法は?

Question

データベースエンジンが必要です。単純なファイルシステムにかなり近いと思います。次のことを行う必要があります。

「フォルダ」内のアイテムを一覧表示する
複数のマシンでの信頼性と速度のためにデータベースをスケーリングする
「フォルダ」と「オブジェクト」の追加/削除
多分重複を避けるためのシンボリックリンク

各「オブジェクト」は、サイズが最大 kB (推測) のデータ (キー:値) のセットになります。

私はcouchbaseとhttp://www.infoq.com/articles/graph-nosql-neo4jを調べましたが、私のニーズに合わないようです. Couchbase は最初の要件をサポートしておらず、Neo4j は高度すぎるようです。(決して使われることのない機能を実装するのはなぜですか?)

データに対する権限やセキュリティは必要ありません。冗長性と速度だけです。書き込みよりも読み取りの方がはるかに多くなります。

これを実装する最良の方法は何ですか? ディスク上のフォルダーが最善の方法でしょうか? 冗長性を備えた多くのサーバーにまたがるにはどうすればよいでしょうか?

編集:
元の問題:
最大 50 個のタグを持つ大量のオブジェクトがあります。平均10個のタグを推測しています。クライアントはタグのリストをサーバーに送信します。サーバーは、ユーザーが送信したすべて (またはほぼすべて) のタグを含むすべてのオブジェクトのリストを返す必要があります。

これまでの私のアプローチ:
1. 可能なすべてのタグのリストを、ある程度出現順に取得します (最初に最も使用されます)。これをとしましょうtaglist。
2. クライアントからのリストをでソートしますtaglist。
3. 次のアルゴリズムを使用します。

algorithm( startFolder ) {
 for each object in startFolder {
      stack.push (object);
 }
 for each folder in startFolder where (folder.name is in listSentByClient) {
      algorithm( folder );
 }
}

4.stackクライアントから送信されたすべてのタグを含むすべてのオブジェクトが含まれるようになりました。5. スタックをクライアントに返す

新しいオブジェクトを追加する場合:
1. タグをで並べ替えますtaglist。これを呼び出しますsortedlist
2. name == 最初のタグでフォルダーを入力または作成しますsortedlist 3. 4 で最初のタグを削除します。sortedlist
タグがなくなるまでステップ 2 と 3 を繰り返し
ます 5. 現在の場所にオブジェクトを作成します

このアプローチが間違っているか、より良いアプローチを知っている場合は、教えてください。

score 0 · Accepted Answer

2.0はElasticSearchと統合されているため、Couchbase 2.0でこれを行うことができます（1.8.xではなく、非常に興味深いキー構造があります。これは実際に行うことができますが、明らかではありません）。ビューとクエリを使用してこれを行うこともできます。

Neo4Jでは、各タグとオブジェクトをノードにし、それらの間に関係（オブジェクトとタグ間の単一の双方向関係）を作成することでこれを行うことができます。タグノードから1レベルの深さのすべてのオブジェクトノードを取得するのは、かなり単純なクエリです。少し洗練されていますが、オブジェクトが持つタグノードのグループとの関係の数に基づいてクエリを実行することもできます。

database-design - スケーラブルなデータベースにツリー構造を実装する良い方法は?

1 に答える 1

Related

Reference