構造化されていない住所文字列と構造化された住所文字列のリストがあります。これらを比較するには何を使用すればよいですか?
住所の例:
Unstructured: john appartments 7 koramangala bangalore india 560066
structured: 7, john appartments, koramangala, bangalore-560066, india
構造化されていない住所文字列と構造化された住所文字列のリストがあります。これらを比較するには何を使用すればよいですか?
住所の例:
Unstructured: john appartments 7 koramangala bangalore india 560066
structured: 7, john appartments, koramangala, bangalore-560066, india
これらの文字列が類似している可能性を見つけることに限定されている場合は、ここで説明されている手法を調べる必要があります。文字列の大規模なセットで類似した文字列のグループを見つける
別のアプローチ - 地図/辞書にアクセスできる場合は、(国の名前、郵便番号、通りの名前などを見つけることによって) 任意の住所を「構造化」してから比較できます。
幸運を