mysql - MySQL データベースの一部のレコードのエンコーディングの問題を修正する方法は?

Question

何年にもわたって、私が研究に使用しているデータベースは、SyBase から MySQL、PostgreSQL、そして MySQL に移行されてきました。

さまざまなエンコードの問題のためにデータが壊れないように非常に慎重に行われましたが、残念ながら多くのレコードが破損しました。

たとえば、レコードの 1 つにと記載されていますJÃ²zefinaが、そうである必要がありますJózefina。

この特定のエンコーディングの問題をプログラムで修正できるかどうか知っている人はいますか?

私はエンコーディングが得意ではありませんが、バイトシーケンスÃ²をóなどにマップすることはできたようです。

Ã²どのエンコーディングがに対応するかを誰かが知っているのではないかと思うóので、壊れたテキストから正しいテキストへのエンコーディングマッピングテーブルを手動で作成する必要はなく、自動的に作成します。

score 1 · Accepted Answer

照合をユニコードに変更します。これを行う：

ALTER TABLE `t1` CONVERT TO CHARACTER SET utf8 COLLATE utf8_general_ci;

テーブルはWindows-1252を使用しています。ご覧のように：

Dec 242
Hex F2
UTF-8 ò
Windows 1252 Ã²

1 に答える 1