5

インポートプロセス中に米国の住所と一致する必要があります。問題は、住所行をいくつかの異なる方法で入力できることです。例:

123 Main Street

123 Main St.

123 Main St

マッチングを行えるようにアドレスを標準化するにはどうすればよいですか?一度に10,000個のアドレスをインポートしているので、Google、Yahoo、USPSなどのサービスは使いたくありません。COMコンポーネントではないアドレス標準化のためのオープンソースまたは商用ライブラリはありますか?住所が本物かどうかは関係ありません。気になるのはマッチングだけです。

4

1 に答える 1

8

この種のものは非常に複雑です。一部の企業は、この機能の提供に完全に基づいています。

これを採用することはお勧めしません。これを行うための既存のライブラリとサービスがあります。

https://www.usps.com/business/address-management-products.htm

http://smartystreets.com/products/liveaddress-api

それらがオプションではなく、参照されたリンク(アドレス一致キーアルゴリズム)が役に立たない場合は、基本的にすべてをいくつかの共通分母にまとめる必要があります。たとえば、文字列を構成要素(通り番号、通り番号の接尾辞、ユニット/スイート番号、通りの名前、通りの種類、通りの方向)に分割します。次に、それぞれの可能なすべての略語(該当する場合)をその共通の分母に変換します。ストリートタイプ「St.」の場合、最小公分母として「street」を選択する場合があります。その場合は、「St。」に変換します。または、「St」から「Street」へのマッチングを実行します。データベース内のすべてのデータに、そのストリートタイプの「street」が含まれていると想定します。

于 2012-09-06T19:05:26.613 に答える