XHTML 1.0 仕様は、http : //www.w3.org/TR/2002/REC-xhtml1-20020801/#xhtml で次のように述べています。
XHTML 1.0 [...] は、3 つの HTML 4 ドキュメント タイプを XML 1.0 [XML] のアプリケーションとして再構築したものです。
XML 1.0 仕様は、http : //www.w3.org/TR/2008/REC-xml-20081126/#syntax で次のように述べています。
文字データとマークアップ: テキストは、文字データとマークアップが混在して構成されます。[...] アンパサンド文字 ( &
) と左山括弧 ( <
) は、マークアップの区切り記号として使用する場合、またはコメント、処理命令、または CDATA セクション内で使用する場合を除き、リテラル形式で表示してはなりません。他の場所で必要な場合は、数字参照または文字列 " &
" と " <
" をそれぞれ使用してエスケープする必要があります。右山かっこ ( >
) は、文字列 " " を使用して表すことができ、互換性のために、コンテンツ内の文字列 " " に表示される場合は " " または文字参照>
を使用してエスケープする必要があります (その文字列が末尾をマークしていない場合)。 CDATA セクションの。>
]]>
これは、XHTML ドキュメントのテキスト部分を記述する場合、&、<、および > をエスケープする必要があることを意味します。
もっと多くのことをエスケープすることができます。ウムラウト u の場合。ドキュメントがたとえば UTF-8 でエンコードされていることを示し、代わりにバイト シーケンス 0xc3bc を記述して、同じウムラウト u を取得することもできます。
ドキュメントの要素部分 (col. "tags") を記述する場合、さまざまな規則があります。", ' や、コメント、CDATA などに関する多くの規則に注意する必要があります。また、要素名や属性名に使用できる文字の規則もあります。XML 仕様で調べることができますが、要素と属性の名前には、文字、数字、および "-" を使用してください。"_" は使用しないでください。属性値については、& と (引用スタイルに応じて) ' または " をエスケープする必要があります。
多くのライブラリの 1 つを使用して XML / XHTML ドキュメントを記述する場合、他の誰かが既にこれを処理しているため、ライブラリにテキストまたは要素を書き込むように指示するだけで済みます。すべてのエスケープはバックグラウンドで行われます。&