algorithm - Btreesをディスクファイルに保存して読み取る

Question

Btree（バイナリのものはわかりません）をディスクファイルに保存したいと思います。そしてそれをメモリに読み込みます。いくつかのレベル順トラバーサルは、バイナリBtreeの良い方法かもしれません。しかし、それがバイナリのものでない場合。メモリ内のリーフノードからルートノードまでBtreeを構築します。ディスクファイルにいくつかの構造を定義し、ツリーノードを出力する必要があると思います。ファイル内のノードを識別するためにいくつかの追加のタグを使用していますか？ここでは、トラバーサルの方法が重要な問題になる可能性があります。ノードとポインタを保存する良い方法がわかりません。そしてそれを読んでください。メモリ内のツリーを再構築します。何か良いアイデアはありますか？どうもありがとう。

score 6 · Accepted Answer

B-Tree の通常の手法は、ノードのサイズがディスクのブロックサイズと同じであることを確認し、ディスクファイルを mmap することです。作業しているプログラミング言語を指定しないため、C でのキャストのように単純な場合もあれば、flyweight オブジェクトを作成して java.nio.IntBuffer をラップするなどのより複雑な場合もあります。いずれにせよ、B ツリーの利点の多くは、一度にすべてをロードする必要がなく、かなり効率的にジャンプできることです。

score 5 · Accepted Answer

本当に似たようなことをしたい場合は、各ノードに id を割り当てて、ノードをその形式で保存できます。

[ノード ID 値左ノード ID 右ノード ID]

次に、幅優先検索でツリーにアクセスします。

ツリーを再構築する場合は、マップ id->node を作成し、ファイルを逆方向に読み取ります。つまり、レコードを読み取るときにノードを作成し、それをマップに登録し、そこからノードをフェッチする左右のノードを割り当てます。地図。

score 0 · Accepted Answer

ノードごとに、ノードが持っているのと同じ情報を保持するデータ構造を定義し、その構造に次の息子のファイル内のオフセットをマークする追加フィールドを追加します。そして、その構造の一番上のフィールドを実際のサイズにします。なぜなら、あなたが今見ているツリーの種類がわからないからです。ファイルをジャンプすると、ツリーを再構築できます。私の解決策は最終的なものではないと確信していますが、それがあなたにとって良いスターポイントになることを願っています.

score -6 · Accepted Answer

Protocol Buffersを確認してください。それらはコンパクトで、バイナリで、拡張可能で、読み書きが簡単で、C++、Java、Python (および他の言語でのサードパーティの実装) で利用できます。

子ノードのファイルオフセットを使用して、BTree ノードのプロトコルバッファメッセージを定義し、それを単純にディスクにシリアル化できます。

algorithm - Btreesをディスクファイルに保存して読み取る

4 に答える 4

Related

Reference