冗長で不良なデータを含むデータベースを取得しました。例として、冠詞の名前の中には大文字と小文字の違いがあるもの、アクセントの問題があるもの、文字がないものなどがあります。アイデアは、実際には同じであるdbレコードをマージすることです。
データベースを簡単にクリーンアップできる優れたツールはありますか?理想的には、これは自動的には実行されませんが、ユーザーの確認が必要になります
冗長で不良なデータを含むデータベースを取得しました。例として、冠詞の名前の中には大文字と小文字の違いがあるもの、アクセントの問題があるもの、文字がないものなどがあります。アイデアは、実際には同じであるdbレコードをマージすることです。
データベースを簡単にクリーンアップできる優れたツールはありますか?理想的には、これは自動的には実行されませんが、ユーザーの確認が必要になります
データクレンジング用のツールは数多くあります。また、データクレンジングをサービスとして提供する企業は他にもたくさんあります。
私はいくつかの大企業のデータクレンジングを実行しましたが、それは簡単な作業ではなく、見た目ほど簡単でもありません。また、データの重複除去には、演習を開始するまで明らかにならないあらゆる種類の問題が伴います.
私見ですが、レガシー データの状態が比較的悪く、この (かなり専門的な) 分野の専門知識を社内に持っていない場合は、サード パーティを雇ってこれを行うことを検討します。ゼロから始めるよりも総コストを低く抑えることができます。
これを行うための社内スキルを構築したい場合は、いくつかの簡単な Google 検索を行って、提供されている多くのソフトウェア パッケージを見てきました。クレンジングしようとしているデータは、特定の領域では他の領域よりも優れているためです。
これが役に立てば幸いです、Ollie。