1

MS SQL Server と互換性のある重複除外ソフトウェアを探しています。私は、世界中の住所がすべての異なる言語で含まれているかなり大規模で乱雑なテーブルを持っています。テーブルは重複を親/子レコードとして処理するように設定されているため、一致を処理する機能が必要です (つまり、重複を削除するだけではありません)。

編集:これが構造です

ParentID | MasterID | PropertyName | Address1 | Address2 | PostalCode | City | StateProvinceCode | CountryCode | PhoneNumber

MasterIDレコードごとに一意です。

ParentIDMasterID各エントリの親レコードの が含まれており、親レコードはMasterID = ParentID.

CountryCode2 文字の ISO 国コードです (電話コードではありません)。

4

1 に答える 1

2

住所の重複は追跡が難しいことで知られています。1 つのアドレスを記述する有効な方法は約 10 通りあり、問題が発生する可能性があります。

場合によっては重複を許可するビジネス ルールがあるという事実を考えると、独自のソフトウェアを展開して、容認できない重複を見つけて削除する方がよいのではないかと思います。

過去に、無料のジオコーディング サービス (Google のマッピング API など) を介して住所を入力し、互いに特定のしきい値 (10 フィートまたは何か) 内にあるポイントを探すことで、住所でこれを行いました。この時点で、それが「容認できない重複」に該当するかどうかを判断し、削除することができます。

座標間の距離を見つけるには、Great Circle Distanceを見つけることをお勧めします。幸運を!

于 2011-08-22T20:28:07.100 に答える