xml - XML での意味は何ですか?

Question

私はしばしば、ファイルでこの奇妙なCDATAタグを見つけXMLます:

<![CDATA[some stuff]]>

このCDATAタグは常に最初に来て、その後に何かが続くことに気付きました。

しかし、使用される場合もあれば、使用されない場合もあります。some stuffその後に挿入される「データ」はマークすることだと思います。しかし、どのようなデータsome stuffですか？XMLタグに書いたものは何かのデータではないですか?

score 1081 · Accepted Answer

CDATAは Character Dataの略で、これらの文字列の間にあるデータには、XML マークアップとして解釈できるデータが含まれているが、そうすべきではないことを意味します。

CDATA とコメントの主な違いは次のとおりです。

Richard が指摘しているように、CDATA は依然として文書の一部ですが、コメントはそうではありません。
]]>CDATA には文字列( ) を含めることはできませんがCDEnd、コメント--には無効です。
パラメータエンティティ参照は、コメント内では認識されません。

これは、整形式の 1 つのドキュメントからの次の 4 つの XML スニペットが与えられたことを意味します。

<!ENTITY MyParamEntity "Has been expanded">

<!--
Within this comment I can use ]]>
and other reserved characters like <
&, ', and ", but %MyParamEntity; will not be expanded
(if I retrieve the text of this node it will contain
%MyParamEntity; and not "Has been expanded")
and I can't place two dashes next to each other.
-->

<![CDATA[
Within this Character Data block I can
use double dashes as much as I want (along with <, &, ', and ")
*and* %MyParamEntity; will be expanded to the text
"Has been expanded" ... however, I can't use
the CEND sequence. If I need to use CEND I must escape one of the
brackets or the greater-than sign using concatenated CDATA sections.
]]>

<description>An example of escaped CENDs</description>
<!-- This text contains a CEND ]]> -->
<!-- In this first case we put the ]] at the end of the first CDATA block
     and the > in the second CDATA block -->
<data><![CDATA[This text contains a CEND ]]]]><![CDATA[>]]></data>
<!-- In this second case we put a ] at the end of the first CDATA block
     and the ]> in the second CDATA block -->
<alternative><![CDATA[This text contains a CEND ]]]><![CDATA[]>]]></alternative>

score 358 · Accepted Answer

CDATAセクションは、「パーサーがマークアップではなく文字データとしてのみ解釈するようにマークされた要素コンテンツのセクション」です。

構文的には、コメントと同様に動作します。

<exampleOfAComment>
<!--
    Since this is a comment
    I can use all sorts of reserved characters
    like > < " and &
    or write things like
    <foo></bar>
    but my document is still well-formed!
-->
</exampleOfAComment>

...しかし、それはまだドキュメントの一部です：

<exampleOfACDATA>
<![CDATA[
    Since this is a CDATA section
    I can use all sorts of reserved characters
    like > < " and &
    or write things like
    <foo></bar>
    but my document is still well formed!
]]>
</exampleOfACDATA>

以下を.xhtmlファイル（ではなく .html）として保存し、FireFox（Internet Explorerではない）を使用して開いて、コメントとCDATAセクションの違いを確認してください。ブラウザでドキュメントを見るとコメントは表示されませんが、CDATAセクションには次のように表示されます。

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en" >
<head>
<title>CDATA Example</title>
</head>
<body>

<h2>Using a Comment</h2>
<div id="commentExample">
<!--
You won't see this in the document
and can use reserved characters like
< > & "
-->
</div>

<h2>Using a CDATA Section</h2>
<div id="cdataExample">
<![CDATA[
You will see this in the document
and can use reserved characters like
< > & "
]]>
</div>

</body>
</html>

CDATAセクションで注意すべき点は、エンコードがないため、文字列を含める方法がない]]>ことです。を含む文字データは]]>、私が知る限り、代わりにテキストノードである必要があります。同様に、DOM操作の観点からは、以下を含むCDATAセクションを作成することはできません]]>。

var myEl = xmlDoc.getElementById("cdata-wrapper");
myEl.appendChild(xmlDoc.createCDATASection("This section cannot contain ]]>"));

このDOM操作コードは（Firefoxで）例外をスローするか、構造化されていないXMLドキュメントになります：http：//jsfiddle.net/9NNHA/

score 74 · Accepted Answer

1 つの大きな使用例: xml にデータとしてプログラムが含まれます (例: Java の Web ページチュートリアル)。そのような状況では、データには '&' と '<' を含む大量の文字が含まれていますが、これらの文字は xml を意図したものではありません。

比較：

<example-code>
while (x &lt; len &amp;&amp; !done) {
    print( &quot;Still working, &apos;zzz&apos;.&quot; );
    ++x;
    }
</example-code>

と

<example-code><![CDATA[
while (x < len && !done) {
    print( "Still working, 'zzzz'." );
    ++x;
    }
]]></example-code>

特に、このコードをファイルからコピーして貼り付ける (またはプリプロセッサに含める) 場合は、XML タグ/属性と混同せずに、必要な文字だけを xml ファイルに含めると便利です。@paary が述べたように、他の一般的な用途には、アンパサンドを含む URL を埋め込む場合が含まれます。最後に、データにいくつかの特殊文字しか含まれていなくても、データが非常に長い (章のテキストなど) 場合でも、xml ファイルを編集するときにこれらの少数のエンティティをエンコード/デコードする必要がないのは便利です。 .

（コメントとのすべての比較は、誤解を招く/役に立たないと思われます。）

score 47 · Accepted Answer

xml 要素に HTML コードを格納する必要がある場合、CDATA を使用する必要がありました。何かのようなもの

<codearea>
  <![CDATA[ 
  <div> <p> my para </p> </div> 
  ]]>
</codearea>

したがって、CDATA は、そうでなければ < や > などの XML タグとして解釈される可能性のある文字を無視することを意味します。

score 36 · Accepted Answer

そこに含まれるデータは XML として解析されないため、有効な XML である必要はなく、XML のように見えてもそうではない要素を含むことができます。

score 19 · Accepted Answer

その使用の別の例として：

RSS フィード (xml ドキュメント) があり、説明の表示に基本的な HTML エンコーディングを含めたい場合は、CData を使用してエンコードできます。

<item>
  <title>Title of Feed Item</title>
  <link>/mylink/article1</link>
  <description>
    <![CDATA[
      <p>
      <a href="/mylink/article1"><img style="float: left; margin-right: 5px;" height="80" src="/mylink/image" alt=""/></a>
      Author Names
      <br/><em>Date</em>
      <br/>Paragraph of text describing the article to be displayed</p>
    ]]>
  </description>
</item>

RSS リーダーは説明を取り込み、CDATA 内の HTML をレンダリングします。

注 - すべての HTML タグが機能するわけではありません。使用している RSS リーダーに依存すると思います。

そして、この例が (適切な pubData および dc:creator タグではなく) CData を使用する理由の説明として: これは、実際のフォーマット制御を持たない RSS ウィジェットを使用した Web サイトの表示用です。

これにより、新しいウィジェットを必要とせずに、含まれる画像の高さと位置を指定したり、作成者名と日付を正しくフォーマットしたりすることができます。これはまた、これをスクリプト化でき、手動で追加する必要がないことも意味します。

score 17 · Accepted Answer

ウィキペディアから:

[In] XML ドキュメントまたは外部の解析済みエンティティでは、CDATA セクションは、パーサーがマークアップではなく文字データのみとして解釈するようにマークされた要素コンテンツのセクションです。

http://en.wikipedia.org/wiki/CDATA

したがって、CDATA 内のテキストはパーサーによって認識されますが、XML ノードとしてではなく、文字としてのみ認識されます。

score 12 · Accepted Answer

CDATA は文字データの略です。これを使用して、通常の XML として扱われる一部の文字をエスケープできます。この中のデータは解析されません。たとえば、次を含む URL を渡したい場合は&、CDATA を使用してそれを行うことができます。そうしないと、通常の XML として解析されるため、エラーが発生します。

score 7 · Accepted Answer

これは、特定の文字が含まれているためにxmlと見なされる可能性のあるデータを含むために使用されます。

このようにして、内部のデータは表示されますが、解釈されません。

score 1 · Accepted Answer

通常、画像や音声データなどのカスタムデータをXMLドキュメントに埋め込むために使用されます。

xml - XML での意味は何ですか?

13 に答える 13

Related

Reference