多くの場合、同じ人物である人物エンティティの複数のインスタンスがあります。アドレスの First-Last が同じアドレスで同じ場合、それらをマージ/ロールアップするのは簡単です。
ただし、データ入力の不一致により、正確さから少し逸脱する方法が必要です。クレジットカード業界はこれを少しやっていると思います:郵便番号と番地、または通りの名前?...その性質の何か。
マッチングを強化するために、住所文字列を整理し、できるだけ標準的なものにするようにしました ("Hwy" --> "Highway" など)。
一目見ただけで一目瞭然に見えるが、完全に一致するデータがないレコードでも一致するものが必要です。
これが私の最初の考えです。次で構成される文字列を連結します。
First Initial
LEFT8 of the LastName (allows inconsistent endings, such as "Esq." or "CPA")
LEFT3 of Zip
Street Number
LEFT8 of the StreetName (not Addr1 -- "Oak" for "8 N Oak Street")
ここで何か見逃しましたか?通常のデータ入力の不一致を克服するのに十分なほど緩いものにしたと思いますが、誤った一致を回避するのに十分なほどタイトにしました.