特定の文字列と比較したい文字列の大きなリスト(200,000以上)があります。指定された文字列はユーザーによって挿入されたため、少し間違っている可能性があります。
私が望んでいたのは、リストに追加するときに、各文字列にある種の事前計算されたハッシュを作成することでした。このハッシュには、文字列の長さ、すべての文字の追加などの情報が含まれます。
私の質問は、このようなものはすでに存在するのでしょうか?確かに、リスト内のすべての文字列でレーベンシュタイン距離を実行しないようにする何かがありますか?
それとも、私がまだ考えていない3番目のオプションがありますか?