ディスクに保存したいハッシュテーブルがあります。リストは次のようになります。
<16-byte key > <1-byte result>
a7b4903def8764941bac7485d97e4f76 04
b859de04f2f2ff76496879bda875aecf 03
etc...
100 万から 500 万のエントリがあります。現在、私はそれらを 1 つのファイルに格納しているだけです。エントリあたり 17 バイト×エントリ数です。そのファイルは数十メガバイトです。私の目標は、最初にディスク上のスペースを最適化し、次に検索時間を最適化する方法でそれらを保存することです。挿入時間は重要ではありません。
これを行う最善の方法は何ですか?ファイルはできるだけ小さくしたい。複数のファイルでもかまいません。パトリシアトライ?基数トライ?
良い提案があれば、実装してテストします。ここに結果を掲載しますので、ぜひご覧ください。