マスターテーブルに多くの重複があります。次の例を参照してください。顧客 ABC Corp はマスター テーブルに 3 回存在し、3 つの CustID すべてが Orders テーブルで参照されています。
**Customers Table**
<table>
<tr><td><strong>CustID</strong></td><td><strong>CustName</strong></td></tr>
<tr><td>1001</td><td>ABC Corp.</td></tr>
<tr><td>1002</td><td>XYZ Corp.</td></tr>
<tr><td>1003</td><td>ABC Corp Ltd.</td></tr>
<tr><td>1002</td><td>ABC Corporation Limited.</td></tr>
</table>
**Orders Table**
<table>
<tr><td><strong>OrderID</strong></td><td><strong>CustID</strong></td></tr>
<tr><td>23425</td><td>1001</td></tr>
<tr><td>23466</td><td>1003</td></tr>
<tr><td>23488</td><td>1003</td></tr>
<tr><td>43877</td><td>1004</td></tr>
</table>
Data Quality Services を使用して Customers テーブルから重複する Customers を削除し、ALSO を使用して Orders テーブルを更新して変更を反映するにはどうすればよいですか。
つまり、CustID 1003 と 1004 は 1001 にマージされ、Orders テーブルの 1003 と 1004 も 1001 に更新する必要があります。
私がこれまでにやってきたこと。CustName のシノニムを使用して顧客のナレッジ ベースを作成し、主要な値を定義しました。次に、DQS でデータ クレンジング プロジェクトを作成し、データを分析してから、マスター データを修正し、それらの修正された値を顧客のナレッジ ベースにインポートしました。SSIS の DQS クレンジング変換は、ソース テーブルと DQS KB に接続することでこれを自動的に行い、一致する行と一致しない行を提供することを理解しましたが、ここから何をすべきかまだわかりません。Customers テーブルのデータがどのように修正され、それに応じて Orders テーブルが更新されたか。提案してください。これまで見てきた例では、テーブルと単純な Excel シートだけでかなり基本的なものを使用しています。