SQL Server 2012 DQS でナレッジ ベースを構築しようとしています。DQS を介して実行しようとしている生データには、残念ながら、人間の名前と会社の名前の両方を保持できるフル ネーム フィールドがあるフィールドがあります。参照データ サービスを購入せずに DQS を使用してこのフィールドをクレンジングおよび解析し、会社名の場合はフィールド全体を FirstName または LastName ドメインに入れる方法についてアドバイスがあるかどうか疑問に思っていましたが、会社ではない場合次に、名前全体を適切なドメインに解析します。
FirstName、MiddleName、および LastName ドメインで構成される FullName という名前の複合ドメインをセットアップし、生データにマッピングしました。次に、複合ドメインの知識ベースの解析を使用して、これらの値をそれぞれのフィールドに解析しようとしましたが、残念ながら、会社名を人であるかのように解析しようとするため、「& Associates Inc」などの姓がたくさん取得されます。
これに取り組む最も簡単な方法は、ビジネス用語のドメインを作成し、基本的に、FullName ドメインの単語のいずれかが BusinessWord ドメインにある場合は、名前全体を FirstName に入れるという複合ドメイン ルールを持つことです。そうでなければ、名前を最初、中間、最後に解析しようとします。このタイプのルックアップは DQS の機能を超えていますか?
これまでのところ、DQS CD ルールについて私が見つけることができる唯一のことは、ハードコードされたルールを作成することです。つまり、都市が「ロンドン」の場合、国を「イングランド」に変更しますが、BusinessWord が FullName の場合、というより動的なルールが必要です。全体を FirstName に入れます。DQS を試している人がこのような問題に遭遇したことがあるかどうか、また参照データ サービスに法外な金額を支払うことなく解決できるかどうか疑問に思っています。
このことで名前と住所をきれいにすることができない場合、それは何の役に立ちますか?
前もって感謝します。