複数の列を持つ 1 つの data.frame があります。最初の列には会社名が含まれています。これらはユーザーによって入力されたもので、多くの値には同じエンティティを表す同様の文字列が含まれています。たとえば、Company A Pty. Company A Pty. Ltd. Company A Georgia.
これらのバリエーションを、別の列の単一の共通文字列 Company A に置き換えたいと思います。stringdist やその他の関数を見てきましたが、このユースケースをサポートしていないようです。
これにより、その共通の文字列に基づいて要約/集計することができます。
Google Refine などのサードパーティ ツールも機能しますが、R 内で操作することをお勧めします。