リスト内の任意の入力に最も類似したエントリを見つけるために、文字列メトリックを見つけようとしています。部分文字列が完全に一致していても、ほとんどの一般的な文字列メトリックは無関係な文字に重きを置いているようです。たとえば、'Corvette, red 2013' と 'corvette' の一致ストアは difflib.get_close_matches() を使用して 0.11 ですが、'octet rev' と 'corvette' の一致スコアは 0.23 です。
私のリストには無関係な情報 (「red 2013」など) が含まれている可能性が高いことはわかっていますが、その無関係な情報を無視して「コルベット」が完全に一致することを知りたいと思っています。私の目的では、「Octet rev」は誤った一致としてカウントされます。
必要な方法で一致を評価する文字列一致メトリックはありますか? さらに良いことに、Python パッケージに既に実装されているものはありますか?