java - Javaで「含む」操作のみを必要とする巨大な静的/不変文字列セットを格納する方法

Question

文字列の膨大なリスト (800 万から 1000 万) があります。ウィキペディアのページタイトルです。これらの文字列に対してセットのようなデータ構造を作成した後、必要な操作はboolean contains(String str).

簡単な方法はHashSet、TreeSetまたは同様のものを使用することです（たとえば、Javaで）。

このユースケースにより適したデータ構造はありますか?

PS: ブルームフィルターは使用できません。誤検知に対処したくありません。

score 1 · Accepted Answer

constant-time よりもスペースを節約することに関心がcontains()あり、保存された文字列に多くの重複がある場合は、トライが役立つ場合があります。その場合、の長さはになりcontains(str)ます。O(n)nstr

1 に答える 1