コンピューターに UTF-16 のファイルがいくつかありますが、これは意図ではなくファイルのエラーまたは破損が原因のようです。ファイルは平易な英語であるはずです。これらの 1 つをアップロードしました (ここ)。Firefox のエンコーディング ([表示] > [文字エンコーディング]) を UTF-8 のままにしておくと、大量の意味不明なメッセージが表示されます (スクリーンショットを参照)。エンコーディングを UTF-16 に変更すると、見栄えが大幅に向上します (スクリーンショット2 を参照)。ただし、CJK 文字がまだ多数存在します。
これらすべてのファイルを調べてクリーンアップし、おそらく utf-8 形式で保存したいと思います (utf8_general_ci 照合を使用する mysql テーブルに内容を挿入します)。PHPを使用して自動化された方法でこれを行う方法を知っている人はいますか? ファイルを UTF-8 で表示しようとすると、ファイルに表示されるファンキーな文字をすべて削除し、UTF-16 で表示すると表示されるすべての CJK 文字を削除したいと思います。