私eng-jap
は本質的に単なる翻訳である表を持っているので、英語と日本語の列があります。私が作成したスクリプトにより、すべての挿入にクローンが作成され、このテーブルに何千もの重複エントリが作成されます。たとえば、次のようになります。
重複例A
eng jap
"mother washes every day" "母は毎日洗濯する"
"mother washes every day" "母は毎日洗濯する"
1列だけの場合は、次のクエリを使用できます。
SELECT eng, COUNT(*) c FROM `eng-jap` GROUP BY eng HAVING c > 1
ただし、テーブルはengまたはjapで合法的に重複する可能性があるため、両方ではない限り. 例えば:
重複例 B
eng jap
"mother washes every day" "母は毎日洗濯する"
"every day mother washes" "母は毎日洗濯する"
これは、1 つの文に複数の翻訳を含めることができるようにするためです。したがって、クエリを変更して、両方の列の組み合わせとして重複を見つける必要があります。
もう一度明確にするために。例Bは問題ありません。例Aのようにすべての重複を選択したいので、すべての重複の1つを削除するスクリプトを作成できます。よろしくお願いします!