xml - DTD における PCDATA と CDATA の違い

Question

DTD#PCDATAのと#CDATAの違いは何ですか?

score 81 · Accepted Answer

PCDATAパーサーによって解析されるテキストです。テキスト内のタグはマークアップとして扱われ、エンティティは展開されます。
CDATAパーサーによって解析されないテキストです。テキスト内のタグはマークアップとして扱われず、エンティティは展開されません。

デフォルトでは、すべてがPCDATA. 次の例では、ルートを無視<bar>すると解析され、コンテンツはなく、1 つの子が含まれます。

<?xml version="1.0"?>
<foo>
<bar><test>content!</test></bar>
</foo>

要素にテキストのみが含まれ、子要素が含まれないように指定する場合は、キーワードを使用します。これは、このキーワードが、要素に解析可能な文字データ (つまり、( )PCDATA未満の文字を除くすべてのテキスト) を含める必要があることを指定するためです。<大なり ( >) 、アンパサンド ( &)、引用 ( ')、および二重引用符 ( ")。

次の例では、<bar>contains CDATA. その内容は解析されないため、<test>content!</test>.

<?xml version="1.0"?>
<foo>
<bar><![CDATA[<test>content!</test>]]></bar>
</foo>

SGML にはいくつかのコンテンツモデルがあります。コンテンツモデルは、#PCDATA要素にプレーンテキストを含めることができると述べています。その「解析された」部分は、その中のマークアップ (PI、コメント、および SGML ディレクティブを含む) が生のテキストとして表示される代わりに解析されることを意味します。また、エンティティ参照が置き換えられることも意味します。

プレーンテキストコンテンツを許可する別のタイプのコンテンツモデルはCDATAです。XML では、要素コンテンツモデルが暗黙的にに設定されない場合がありますCDATAが、SGML では、要素のコンテンツでマークアップとエンティティ参照が無視されることを意味します。ただし、タイプの属性でCDATAは、エンティティ参照が置き換えられます。

XML では#PCDATA、唯一のプレーンテキストコンテンツモデルです。要素にテキストコンテンツを許可したい場合に使用します。CDATAコンテンツモデルは、のブロックマークアップを通じて明示的に使用できますがCDATA、#PCDATA要素のコンテンツはデフォルトで定義されていない場合がありCDATAます。

DTD では、テキストを含む属性の型はでなければなりませんCDATA。属性宣言のキーワードは、XML ドキュメントCDATAのセクションとは異なる意味を持ちます。セクションでは、終了タグを除くすべての文字 ( CDATA、、、および文字を含む)が有効です。CDATA<>&'"]]>

#PCDATA属性のタイプに適していません。「リーフ」テキストのタイプに使用されます。

#PCDATAこのキーワードを指定された要素と区別するために、コンテンツモデルの先頭にハッシュが追加されますPCDATA(これは完全に合法です)。

score 78 · Accepted Answer

PCDATA - 解析済み文字データ

XML パーサーは通常、XML ドキュメント内のすべてのテキストを解析します。

CDATA - (解析されていない) 文字データ

CDATA という用語は、XML パーサーによって解析されるべきではないテキストデータについて使用されます。

「<」や「&」などの文字は、XML 要素では使用できません。

score 14 · Accepted Answer

14

于 2016-12-26T19:28:50.930 に答える

score 12 · Accepted Answer

ここから( Google はあなたの友達です):

DTD では、PCDATA と CDATA を使用して、要素と属性の許容可能な内容について何かをアサートします。要素のコンテンツモデルでは、#PCDATA は要素が「古いテキスト」を含む (含む可能性がある) ことを示します。(以下に示す例外を除きます。) 属性の宣言では、CDATA は、属性の許容値に適用できる一種の制約です (その他の種類はすべて相互に排他的で、ID、IDREF、および NMTOKEN が含まれます)。許容値が CDATA である属性には、(要素内の PCDATA のように) 「任意の古いテキスト」を含めることができます。

非常に紛らわしい可能性がある問題は、マークされたセクションとも呼ばれる別の「CDATA」があることです。マークされたセクションは、特殊な文字列で区切られた要素 (#PCDATA) コンテンツの一部です: それを閉じます。PCDATA が「解析された文字データ」であることを覚えていれば、CDATA セクションは「解析された」部分がなくても文字通り同じものです。パーサーは、< や & などの特殊文字に遭遇するたびに問題なく、マークされたセクションのコンテンツをダウンストリームアプリケーションに送信します。これは、これらの特殊文字 (スクリプトやコードフラグメントなど) を多数含むドキュメントをコーディングする場合に便利です。対応するエンティティ参照よりも、データの入力と読み取りが簡単です。

したがって、「すべての古いテキスト」規則の例外は、PCDATA がこれらのエスケープされていない特殊文字を含めることはできないということであると推測できます。

xml - DTD における PCDATA と CDATA の違い

7 に答える 7

Related

Reference