私たちは、すべてのバリエーションで来る雇用者のユーザー生成名を持っています。たとえば、ユーザーは次のように入力またはインポートしました。
Google
Google、Inc.
Google Inc. Google
Inc.
これをデータベース検索すると、まるで別の会社のように見えます。各雇用主を「正規化された」名前にマッピングするようにいくつかの変更を加えましたが、合計で70,000になると、手作業で行うのが難しくなります。
既存のエントリを正規化する方法、およびすべての着信名に対してもそれを維持する方法について誰かが提案を持っていますか?