2 つの文字列間の文字列の類似性を見つけたい。このページには、それらのいくつかの例があります。Python にはレーベンシュタイン アルゴリズムが実装されています。これらの制約の下で、より優れたアルゴリズム (およびできれば Python ライブラリ) はありますか。
- 文字列間のあいまい一致を実行したい。たとえば、matches('Hello, All you people', 'hello, all you people') は True を返す必要があります
- 偽陰性は許容されますが、非常にまれなケースを除いて、偽陽性は許容されません。
- これは非リアルタイム設定で行われるため、速度は (あまり) 重要ではありません。
- [編集] 複数の単語の文字列を比較しています。
私の場合、レーベンシュタイン距離(またはレーベンシュタイン比)以外の何かがより良いアルゴリズムでしょうか?