Webページにcharsetを含む入力フィールドがあるとしUTF8
ます。charsetとしてエンコードされたテキストファイルを開いたとしますISO-8859-1
。
ここで、特殊文字(たとえば、ô
)を含む文字列をファイルから入力フィールドにコピーして貼り付けます。特殊文字が入力フィールドに正しく表示されていることがわかります。
誰からISO-8859-1
への変換を行いUTF8
ますか?ブラウザ?
Webページにcharsetを含む入力フィールドがあるとしUTF8
ます。charsetとしてエンコードされたテキストファイルを開いたとしますISO-8859-1
。
ここで、特殊文字(たとえば、ô
)を含む文字列をファイルから入力フィールドにコピーして貼り付けます。特殊文字が入力フィールドに正しく表示されていることがわかります。
誰からISO-8859-1
への変換を行いUTF8
ますか?ブラウザ?
ファイルを開いてブラウザにコピーして貼り付けると、Unicodeになります。これは、ブラウザのUIコントロールが内部で使用するものだからです。ISO-8859-1からUnicodeへの変換を実際に実行するのは、いくつかの要因(使用しているOS、選択したテキストエディタがAnsiまたはUnicodeを使用するようにコンパイルされているかどうか、どのクリップボード形式(CF_TEXT
Ansiの場合CF_UNICODETEXT
、Unicodeの場合))によって異なります。 -アプリはコピーなどに使用します)。ただし、いずれの場合も、Webブラウザーがフォームを送信すると、送信中にUnicodeデータがHTML/フォームの文字セットにエンコードされます。
おそらく、実際にはUTF-8に変換されるのではなく、ブラウザで使用される文字の内部表現に変換されます。これは、UTF-16である可能性が非常に高くなります(Webページのエンコーディングに関係なく)。