今、私は恐ろしい「E」という言葉を言うつもりです. エンコーディング。私はそれがインターネット上で死に至るまでカバー さ れていることを認識していますが、明確にする必要があることがいくつかあります.
これで、文字セットが ISO-8559-1 で、一連の latin1_swedish_ci フィールドに書き込むスクリプトができました。これらのフィールド内のデータは正確ではありませんが、文字列内に ê や çà などの記号が表示されます。これらは明らかに「非標準」文字です。
出力に関して言えば、HTML を ISO-8859-1 で提供するとコンテンツが正しくレンダリングされませんが、UTF-8 を使用するとほとんどのコンテンツがレンダリングされます。
質問に移ります:
複数のバイトを使用する必要があるため、データベースがデータを人間の目には間違って保存していると思いますが、これは正しいですか?
UTF-8 文字セットを使用するとほとんどのシンボルが正しくレンダリングされるのに、ISO を使用すると正しくレンダリングされないのはなぜですか?
すべての文字をデータベースに保存して正しくレンダリングするには、全体で UTF-8 を使用する必要があると思います。先に進むと、ヒットするか、この種のデータをDBに保持して毎回変換することは許容されますか. 英語以外のキャラクターがたくさんいます。
ありがとう
リチャード