この質問は、名前/住所データを照合するためのツールに関連しています。SAS、Oracle、Microsoftなどが提供する多数の商用ツールがあり、複数のソースからの個人または企業の名前を重複排除またはマージすることができます。
しかし、前述の質問に対する回答を読んだ後、なぜ一見興味深い問題が、その問題に取り組むことができるオープンソースプロジェクトについて言及する回答を受け取らなかったのか疑問に思いました。
いわゆる「レコードのリンク」、「レコードのマージ」、または「クラスタリング」を実装するためのオープンソースプロジェクトまたはアルゴリズムを知っていますか?