代理店の名前と住所が記載されたCSVを持っています。同じアドレス(具体的には同じ郵便番号)の代理店名の文字列が必要な場合、RまたはPythonでそれを行うにはどうすればよいですか?どちらの方法が最も効率的であるかが望ましいですが、私はまだ両方を学んでいます。Google Refineは、すでに各郵便番号クラスターの数を教えてくれましたが、どの機関がそれらの郵便番号に対応しているかを知る必要があります。
PS。はい、私は郵便番号を頼りにするのは良くないことを知っています。これのポイントはそれを説明することです。
入力データの例:
最終出力(後でシェープファイルとマージされます):