difflib のドキュメントを確認しましたが、difflib.SequenceMatcher.ratio()
実際の動作について混乱しています。このことを考慮 :
s = difflib.SequenceMatcher(None, "hey here" , "hey there").ratio()
print s
私はs = 0.9411764705882353
それがどのように正確に計算されるか知りたいと思っていました. 2つの文字列は、1つの文字列と他の文字列の偏差を実際に調べることで比較されます。2つの文字列aとbの場合、ドキュメントは次のように述べて います。
差分は、「'a' を 'b' に変更するために何をする必要があるか?」として計算されます。
そして、次のようなものがあります:
b 内の x の場合、b2j[x] は x が現れる (b 内の) インデックスのリストです。ジャンク要素が出てこない
上記のs の例について説明してください。