2

これまでに発生したすべての行変更を保存するテーブルがあります。問題は、アプリケーションの最初に、すべての行のコピーを大量に作成するバグがあったことです。

テーブルは次のようになります。

copies
|ID |CID |DATA
| 1 | 1  |  DA
| 2 | 2  |  DO
| 2 | 3  |  DO (copy of CID 2)
| 1 | 4  |  DA (copy of CID 1)
| 2 | 5  |  DA
| 1 | 6  |  DA (copy of CID 1)
| 2 | 7  |  DO

CIDは、テーブルコピーではUNIQUEです。

私が欲しいのは、CIDでソートされたDATA GROUPBYIDの重複をすべて削除することです。

表からわかるように、CID 2と3は同じであり、次々に配置されています。CID3を削除したいと思います。CID4とCID6でも同じです。それらの間にID1はなく、CID1のコピーです。

重複を削除した後、テーブルを次のようにします。

copies
|ID |CID |DATA
| 1 | 1  |  DA
| 2 | 2  |  DO
| 2 | 5  |  DA
| 2 | 7  |  DO

助言がありますか?:)

誰もが最善だと思う答えがこの結果をもたらすので、私の質問はひどく尋ねられたと思います:

ID   | DATA | DATA | DATA | DATA | DATA |     DATA |        CID          |
                                                   |Expected |  Quassnoi |
1809 |    1 |    0 |    1 |    0 |    0 |     NULL |  252227 |    252227 |
1809 |    1 |    0 |    1 |    1 |    0 |     NULL |  381530 |    381530 |
1809 |    1 |    0 |    1 |    0 |    0 |     NULL |  438158 | (missing) |
1809 |    1 |    0 |    1 |    0 | 1535 | 20090113 |  581418 |    581418 |
1809 |    1 |    1 |    1 |    0 | 1535 | 20090113 |  581421 |    581421 |

CID252227とCID438158は重複していますが、CID381530がそれらの間にあるためです。これは残しておきたいです。CIDとIDで注文するときに、次々に続くのは重複だけです。

4

4 に答える 4

5
DELETE   c.*
FROM     copies c
JOIN     (
         SELECT  id, data, MIN(copies) AS minc
         FROM    copies
         GROUP BY
                 id, data
         ) q
ON       c.id = q.id
         AND c.data = q.data
         AND c.cid <> q.minc

アップデート:

DELETE  c.*
FROM    (
        SELECT  cid
        FROM    (
                SELECT  cid,
                        COALESCE(data1 = @data1 AND data2 = @data2, FALSE) AS dup,
                        @data1 := data1,
                        @data2 := data2
                FROM    (
                        SELECT  @data1 := NULL,
                                @data2 := NULL
                        ) vars, copies ci
                ORDER BY
                        id, cid
                ) qi
        WHERE   dup
        ) q
JOIN    copies c
ON      c.cid = q.cid

このソリューションは、MySQLセッション変数を使用します。

を使用する純粋なANSIソリューションがありますが、オプティマイザの動作NOT EXISTSが原因で遅くなります(相関サブクエリではアクセス メソッドを使用しません)。MySQLrange

非常に近いタスクのパフォーマンスの詳細については、私のブログのこの記事を参照してください。

于 2009-08-24T12:27:04.180 に答える
1

countこれには、サブクエリで aを使用できます。

delete from copies
where
    (select count(*) from copies s where s.id = copies.id 
                                   and s.data = copies.data 
                                   and s.cid > copies.cid) > 0
于 2009-08-24T12:25:03.057 に答える
1
// EDITED for @Jonathan Leffler comment
//$sql = "SELECT ID,CID,DATA FROM copies ORDER BY CID, ID";
$sql = "SELECT ID,CID,DATA FROM copies ORDER BY ID, CID";
$result = mysql_query($sql, $link); 
$data = "";
$id = "";
while ($row = mysql_fetch_row($result)){ 
       if (($row[0]!=$id) && ($row[2]!=$data) && ($id!="")){
            $sql2 = "DELETE FROM copies WHERE CID=".$row[1];
            $res = mysql_query($sql2, $link); 
       }
       $id=$row[0];
       $data=$row[2];
} 
于 2009-08-24T12:32:41.717 に答える
0

コピーから削除 c where c.cid in (max(cid) を max_cid として選択し、count(*) をコピーから num として選択し、num > 1 は ID でグループ化し、データ)

于 2009-08-24T12:35:45.057 に答える