データベース内の各エントリを調べ、単一の値がデータベース内の他の場所で重複しているかどうかを確認し、重複している場合は両方のエントリ (または 2 つ以上の場合はすべて) を削除するクエリが必要です。
問題は、エントリが最大 255 文字の URL であり、行を識別する方法がないことです。Stack Overflow に関するいくつかの既存の回答は、パフォーマンスの制限のために機能しないか、文字列を処理するときに明らかに機能しない uniqueid を使用しています。
長いバージョン:
URL (および URL のみ) を含む 2 つのデータベースがあります。1 つのデータベースには約 3,000 の URL があり、もう 1 つのデータベースには約 1,000 の URL があります。
ただし、1,000 の URL の大部分は 3,000 の URL データベースから取得されました。新しいエントリのみとして、1,000 を 3,000 にマージする必要があります。
このために、両方のテーブルの URL を組み合わせて、約 4,000 エントリの 3 つ目のデータベースを作成しました。このデータベース内のすべての重複エントリを見つけて削除する必要があります (両方とも、どちらも残さずに)。
このサイトのいくつかの例のクエリに従いましたが、両方のエントリを削除しようとすると、すべてのエントリが削除されるか、SQL エラーが発生します。
別の方法: 2 つのデータベースがあり、それぞれに別のデータベースが含まれています。あるデータベースの各行を別のデータベースと照合して、重複していない行を見つけてから、それらを 3 番目のデータベースに追加する必要があります。