2

Webアプリケーションには、以下のエンコーディングのHTMLページがあります。

<meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
<meta content="en" http-equiv="Content-language">
<meta content="text/html; charset=UTF-8" http-equiv="Content-type">

実際に起こっていることは、このページで私は石鹸リクエストの結果を表示しようとしています。このsoap-requestに応答して、次のコードを取得しています。

&#232;&#233;&#224;&#249;&#236;&#231;&#242;

次の文字の場合:

  èéàùìçò

驚くべきことに、HTMLページでは、ページのエンコーディングがUTF-8であることに加えて、これらの文字は次のように正しく表示されます。

èéàùìçò instead of ������� 

これらのコードはISO-8859-15に属しているため、UTF-8形式でこれらのコードを正しく変換する方法を理解できません。何か考えはありますか?

4

1 に答える 1

2

The character references such as &#232; have meanings based on the Unicode numbers of characters, quite independently of the character encoding of the page. This has always been the principle in HTML, and only very early browsers sometimes got this wrong. This is one of the main benefits of using character references.

The first 256 code positions in Unicode are identical with ISO-8859-1 code positions, which in turn are identical with ISO-8859-15 code positions except for a few characters (not including those in your example).

于 2013-03-22T10:19:51.457 に答える