サブジェクト テーブルには 3,000 万行あります。重複を見つけるためにクエリを実行していますhash
。hash
と定義されている
`hash` varchar(50) NOT NULL;
クエリは
SELECT Count(*)
FROM (SELECT Count(id) `num`,
`signature`
FROM `images`
WHERE `hash` IS NOT NULL
GROUP BY `hash`
HAVING `num` > 1) AS `count_table`
Ctrl+C
クエリを中止するように押すまでに、約 5 ~ 7 分かかります。もう一度実行しましたが、それほど長く待つことができませんでした。
どうすればこの結果をより速く得ることができますか?
グループバイをしている間、これは少し遅くなるでしょう。でも8分は長すぎると思います。