COMPANYNAMEやADDRESSLINE1などのフィールドに一致する大規模なデータベースで重複する可能性のあるレコードを見つけたい
例:
次のCOMPANYNAMEのレコードの場合:
- 「Acme、Inc。」
クエリで、これらのCOMPANYNAME値を持つ他のレコードを可能な限り重複して吐き出したいのですが。
- 「アクメ・コーポレーション」
- 「Acme、Incorporated」
- 「アクメ」
結合、相関サブクエリなどを実行して、必要なデータセットをプルするメカニズムを実行する方法を知っています。そして、私はそれが以前にここでカバーされたことを知っています。あいまい検索を行うための最良の方法についての考えを聞くことに興味があります-全文索引またはsoundex関数、またはこのプロセスに気付いていない何かを使用する必要がありますか?(SQL Server 2005を使用しています)
どんな助けでも大歓迎です!