以下の2つのリストがあり、類似したレーベンシュタイン距離が2未満の単語かどうかを比較したいと思います。レーベンシュタイン距離を見つける機能がありますが、パラメータとして2つの単語が必要です。他のリストにない単語を見つけることはできますが、役に立ちません。そして、インデックスごとに移動できますが、以下の場合のように、インデックス 7 に到達すると (ただし、それ以外) すべてが破棄されます。これは、不貞がインデックス 9 と 8 になり、wcop88 が 9 と 10 になるため、それらは比較されないためです。不貞の一部が他のリストの単語に含まれているかどうかを言う方法はありますか?次に、これら2つを確認してください。おそらくそれと一致する
[u'rt', u'cuaimatizada', u's', u'cuaimaqueserespeta', u'forgives', u'any', u'mistake', u'but', u'the', u'infidelity', u'wocp88']
[u'rt', u'cuiamatizada', u's', u'cuimaqueserespeta', u'forgive', u'any', u'mistake', u'except', u'infedelity', u'wcop88']
編集:したがって、私の目標は、チェックする必要がある2つの単語をレーベンシュタイン関数に供給できるようにすることです。この場合、次のペア:
u'cuaimatizada u'cuiamatizada
u'cuaimaqueserespeta u'cuimaqueserespeta
u'forgives u'forgive
u'infedelity u'infidelity
u'wocp88 u'wcop88
事前にどの言葉かわかりません。