表現方法にバリエーションがある2つの名前がある場合、名前の類似性/相違性のスコアを与えることができるAPI /ツール/アルゴリズムはありますか?
Tim O'Reillyは1つの入力であり、TReillyは別の入力です。これら2つの間で返されるスコアは、TimO'ReillyとTimReillyの間で得られるスコアよりも低くなるはずです。
そのようなスコア計算メカニズムを探しています。アルゴリズムが処理できる必要があるいくつかの課題は次のとおりです
。1)名前が入力として指定された場合、名前と名前が入れ替わる
可能性があります。2)名前の代わりにイニシャルがある可能性があります
。3)名前の1つに名前がない可能性があります。姓。もう一方は名と姓の両方を持つことができます。
...など、名前表現の一般的なエラーです。