Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
2 つのストリングのジャロ距離を計算するには、次の式を使用します。
dj = 1/3 (m/|s1| + m/|s2| + (mt)/m)
この式の 2 つの文字列の "m" を計算するにはどうすればよいですか?
"m" が 2 つの文字列の差である場合、ウィキペディアの 2 つの文字列 "MARTHA" と "MARHTA" の例で、m が 6 であるのはなぜですか。文字列の差は 6 ではなく 1 であるため、1 にすべきだと思います。 ! 私は正しいですか?
mは、位置に関係なく 2 つの文字列間で共有される文字の数であり、距離がそれよりも遠くないことを示しますd = floor(max(len(String1), len(String2)) / 2) - 1(Michael Foukarakis に感謝)。これは と に対して 6MARTHAですMARHTA。
m
d = floor(max(len(String1), len(String2)) / 2) - 1
MARTHA
MARHTA
t共有されているが異なる位置にある文字の数を 2 で割った値です。この場合、2 つの文字 (HとT) が共有されていますが、異なる位置にあるのでt = 2/2 = 1、
t
H
T
t = 2/2 = 1