何百万ものエントリを含む 12 GB のテキストという巨大なダンプ ファイルがあります。各エントリには、数値 ID、一部のテキスト、およびその他の無関係なプロパティがあります。このファイルを、効率的なルックアップを提供するものに変換したいと考えています。つまり、id を指定すると、テキストがすぐに返されます。制限:
- できれば外部サーバーや外国語に依存しない Java に埋め込まれています。
- インメモリではなく、ディスクの読み取りと書き込み - 12GB の RAM がありません。
- 爆発しすぎない - 12GB のファイルを 200GB のインデックスに変えたくありません。全文検索、並べ替え、または特別なものは必要ありません。キーと値のルックアップだけです。
- 効率的 - 大量のデータがあり、マシンが 1 台しかないため、速度が問題になります。大きなバッチを保存できるツールや、複数のスレッドで適切に機能するツールが推奨されます。
- 複数のフィールドを保存するのは良いことですが、必須ではありません。主な関心事はテキストです。
あなたの推薦は大歓迎です!