私はSQL Server 2008 dbを持っており、3億件を超えるレコードのテーブルの2つの特定の列に焦点を当てています。テーブルにある重複レコードを見つけたかったのですが、この結果セットから区別したかったのは、重複の数と重複のいずれかに異なるフィールドがあるかどうかです 2。
フィールド 1: idUrl フィールド 2: assignedId
もちろん重複の場合:
SELECT [idUrl]
,[assignedId]
FROM [Feeds].[dbo].[LogFeed]
group by idUrl, assignedId
having COUNT(entryId) > 1
order by entryid desc
したがって、idUrl の重複に対して、重複する idUrl に対して assignedId が同じではないレコードがあるレコードを見つけたいと思います。
例えば
idUrl assignedID
www.google.com 10
www.google.com 10
www.google.com 10
www.google.com 7