この質問は厳密に DQS パフォーマンスに関連しています。
クリーンアップする必要がある「customers」テーブルには 40,000,000 行あります...サブセットを使用して一致するポリシーを作成しました (問題はありません。上位 10,000 を使用しただけです)。
今、データ品質プロジェクトを実行したいのですが… 1 つのプロジェクトでテーブル全体を取得することはできません… 反応しません… 一度に 400,000 しか処理できず、その状況でもほぼ 2 時間かかります… id が 1 から 400,000 の間のビューでプロジェクトを実行する必要があるため、これは最適なソリューションではありません。
この人たちへの解決策はありますか?
私も疑問に思っています…ボトルネックはどこですか?CPUですかディスクですか?
よろしく。