5

2 つのストリングのジャロ距離を計算するには、次の式を使用します。

dj = 1/3 (m/|s1| + m/|s2| + (mt)/m)

この式の 2 つの文字列の "m" を計算するにはどうすればよいですか?

"m" が 2 つの文字列の差である場合、ウィキペディアの 2 つの文字列 "MARTHA" と "MARHTA" の例で、m が 6 であるのはなぜですか。文字列の差は 6 ではなく 1 であるため、1 にすべきだと思います。 ! 私は正しいですか?

4

1 に答える 1

9

mは、位置に関係なく 2 つの文字列間で共有される文字の数であり、距離がそれよりも遠くないことを示しますd = floor(max(len(String1), len(String2)) / 2) - 1(Michael Foukarakis に感謝)。これは と に対して 6MARTHAですMARHTA

t共有されているが異なる位置にある文字の数を 2 で割った値です。この場合、2 つの文字 (HT) が共有されていますが、異なる位置にあるのでt = 2/2 = 1

于 2013-09-03T14:52:56.413 に答える