0

約 180,000 語の辞書から約 400,000 ノードのトライを作成しました。問題は、私の電話でトライを構築するのに時間がかかりすぎることです。

そこで、必要なときにすぐに再作成できるように、一度トライを作成し、何らかの形式でディスクに保存することにしました。しかし、それを保存するための適切な形式を思い付くことができません。

ファイルからできるだけ早く再構築できるように、トライをエンコードする最も効率的な形式は何ですか?

4

2 に答える 2

0

たぶん良い考えです-位置に依存しないコードのメモリバッファで試行し続け、mmap() によってメモリに読み込みます。これは、"コールド スタート" から trie を操作するためのほとんどの方法です。

また、試行ではなくハッシュテーブルにデータを保持できるかもしれません。この方法では、非常に小さい「バケット インデックス」のみをメモリに保持できます。そして、ハッシュを計算するとき - pread() はファイルからメモリにバケットし、ロードされた部分を検索します。

于 2013-09-25T19:34:41.240 に答える