妥当なサイズが 1 ~ 50K の範囲のオブジェクトのコレクションを扱っています (ただし、上限は設定されていません)。各オブジェクトには、いくつかの文字列が含まれています。
これらの文字列のいずれかに部分的、完全、または RegEx と一致し、その後オブジェクトのリストを返すことができる検索関数を実装したいと考えています。
各オブジェクトに含まれる文字列が 1 つだけの場合、単純にそれらを辞書順に並べ替えて、範囲をかなり簡単に引き出すことができますがmap
、速度/メモリの問題から、含まれる各文字列に対して - のような構造を実装することには消極的です。
速度とメモリ効率のために、この種の操作に適したデータ構造はありますか? データベースの可能性を感じていますが、私はそれらについてほとんど知らないので、より知識のある誰かが私を正しい方向に向かわせてくれるまで、研究を延期したいと思います!