データには、数十億の ID スコアのペアなどの情報が含まれています。これらのペアの情報にすばやくアクセスするには、検索の時間の複雑さが O(1) であるため、ハッシュ テーブル コンテナーを使用する予定です。生データが約 80G であることを考えると、検索アプリケーションを実行する必要があるたびにデータを RAM にロードしたくありません。私がやりたいことは、ハッシュテーブルを一度生成し、それをファイルシステムの存続期間を維持して RAM に保存し (RAM の消費は基準ではありません)、さまざまなアプリケーションで検索することです。
私の限られた理解に基づいて、「メモリマップファイル」(ブーストC++ライブラリ)を使用できました。しかし、私は質問があります:
1)マップされたファイルに書き込むときにハッシュテーブルのデータ構造を維持することは可能ですか? 2) 既存のファイルを RAM にマップするのにどれくらいの時間がかかりますか?
回答/コメント/提案は大歓迎です!
ありがとう、