2

この質問は厳密に DQS パフォーマンスに関連しています。

クリーンアップする必要がある「customers」テーブルには 40,000,000 行あります...サブセットを使用して一致するポリシーを作成しました (問題はありません。上位 10,000 を使用しただけです)。

今、データ品質プロジェクトを実行したいのですが… 1 つのプロジェクトでテーブル全体を取得することはできません… 反応しません… 一度に 400,000 しか処理できず、その状況でもほぼ 2 時間かかります… id が 1 から 400,000 の間のビューでプロジェクトを実行する必要があるため、これは最適なソリューションではありません。

この人たちへの解決策はありますか?

私も疑問に思っています…ボトルネックはどこですか?CPUですかディスクですか?

よろしく。

4

0 に答える 0