3

一致させる会社名がたくさんあります。たとえば、次の文字列を一致させたいとします。A&A PRECISION

A&A PRECISION ENGINEERING

ただし、私が使用するほぼすべての類似度: ハミング距離、レーベ​​ンシュタイン距離、制限付きダメラウ-レーベンシュタイン距離、完全なダメラウ-レーベンシュタイン距離、最長共通部分文字列距離、Q グラム距離、コサイン距離、ジャカード距離ジャロ、ジャロ-ウィンクラー距離など

一致:B&B PRECISION代わりに。

部分文字列とそのシーケンスの正確さをより重視し、文字列の長さをあまり気にしないメトリクスはどれですか? メトリックが常に間違って選択するのは、文字列の長さのためだと思います。

4

1 に答える 1