ドイツ語とフランス語のコンテンツを含む小さなウェブサイトを作成しています。一部のドキュメントでは、すべてのウムラウトがコードではなく äöü と書かれていても、テキストが正しく表示されます。他のドキュメントにはコードが必要ですが、ドキュメント間の違いが見つかりません。
答えをグーグルで検索しようとすると、大量のコード参照しか見つかりませんが、一部のドキュメントがそれらを必要としない理由の説明はありません。
どの HTML ドキュメント (またはその点についてはすべてのテキスト ドキュメント) は、特定のエンコーディングにエンコードされます。これは、文字とそれらを表す値の間のマッピングです。異なるエンコーディングは異なる文字を意味します。
多くのページは Unicode エンコーディングである UTF-8 を使用しており、HTTP ヘッダーまたはページ自体のメタ タグ (Content-Type) でそのように記述されています。このようなページでは、ほとんどの文字を直接使用できます。
なぜなら、HTML仕様によると:
オーサリング ツール (テキスト エディタなど) は、選択した文字エンコーディングで HTML ドキュメントをエンコードする場合があります。
一部のドキュメントでは、文字を直接表現できるエンコーディング ( iso‑8859‑1、Windows‑1252、またはutf‑8など) を使用しています。ä
他のユーザーは、使用できないエンコーディング ( us‑asciiなど) を使用しているため、 character entity reference を使用する必要がありますä
。
1) html-code (メタ) の charset-declaration 2) ドキュメントのエンコーディング。たとえば... UTF-8 を使用していて、ISO 8859-1 に 1 つのドキュメント (たとえば js ファイル) がある場合、一部のブラウザーは ISO 8859-1 のサイトを表示し、あなたのファイルを破壊します。 ...