このトピックは以前に何度も出てきたことを知っていますが、メモリの問題またはストレージがいっぱいになったためにラップトップが計算を停止したため、提案されたソリューションはどれも私のデータセットでは機能しませんでした。
私のテーブルは次のようになり、108
Mio 行 があります。
Col1 |Col2 | Col3 |Col4 |SICComb | NameComb
Case New |3523 | Alexander |6799 |67993523| AlexanderCase New
Case New |3523 | Undisclosed |6799 |67993523| Case NewUndisclosed
Undisclosed|6799 | Case New |3523 |67993523| Case NewUndisclosed
Case New |3523 | Undisclosed |6799 |67993523| Case NewUndisclosed
SmartCard |3674 | NEC |7373 |73733674| NECSmartCard
SmartCard |3674 | Virtual NetComm|7373 |73733674| SmartCardVirtual NetComm
SmartCard |3674 | NEC |7373 |73733674| NECSmartCard
一意の列はSICComb
とNameComb
です。私は主キーを追加しようとしました:
ALTER TABLE dbo.test ADD ID INT IDENTITY(1,1)
30
しかし、整数は新しい数分でストレージのGBを超えていっぱいになっています。
テーブルから重複を削除する最も高速で効率的な方法はどれですか?