1

フォーマットされていないドキュメントがたくさんあります。

住所、郵便番号、州、電話番号、電子メール、そのような一般的な形式をキャプチャするには、正規表現が必要です...

4

2 に答える 2

2

このサイトは、検索可能な正規表現のライブラリを提供しています。この正規表現クックブックには、正規表現の一致パターンの例が何百も含まれています。

于 2009-09-10T02:44:10.743 に答える
0

住所の場合、およびある程度の郵便番号の場合、正規表現はこれまでのところしか実行できません。実際のところ、米国内であっても、番地の形式は非常に多様であるため、通りを正規表現しようとすることは本質的に不可能です。

厳密にフォーマットされた米国ベースの郵便番号でかなりうまく機能している正規表現は次のとおりです。^\d {5}([-+]?\ d {4})?$

米国では、郵便番号は通常次のようにフォーマットされています。

  • 12345
  • 123456789
  • 12345-6789
  • 12345 + 6789 12345-67ND(はい、あなたはその権利を読んでいます、時には最後の2つは「ND」である可能性があります)

もう1つの問題は、ニューイングランドのZIPなどのゼロプレフィックス付きZIPがExcelで実行され、先行ゼロが削除されて4桁の数字が残った場合です。これが、米国ベースの郵便番号のような「単純な」ものであっても、正規表現だけでは100%仕事を終わらせることができない理由です。

ビジネスニーズに応じて、住所確認ソリューションを調査する必要があります。彼らの塩に値するオンラインプロバイダーは、アドレスが本物であるかどうかを教えてくれる標準化と検証とアドレス指定ができ、詐欺や返送などを減らすのに役立ちます。

完全な開示のために、私はSmartyStreetsの創設者です。アドレスのクリーンアップ、標準化、検証を行うオンラインアドレス検証サービスがあります。ご不明な点がございましたら、個人的にご連絡いただければ幸いです。

于 2011-10-13T03:30:49.277 に答える