問題タブ [pcdata]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xml - PCDATA内のCDATA
私はこのテキストを読みましたが、理解できませんでした:
PCDATA は解析された文字データを意味するため、この場合、宣言された要素の内部に文字データを含めることができるようになりました。解析されていない CDATA セクションを含む要素を定義する方法があるかどうか疑問に思うかもしれません。
答えは、CDATA タグ自体が実際に解析されることです。解析されないのは、CDATA セクション内のテキスト コンテンツのみです。したがって、CDATA セクションにすぎないとは言えません。定義するのは #PCDATA です。そして、それは要素がその内部にパースキャリッジデータを持つことができることを示しています.
言い換えればどう言えばいいでしょうか?何を意味しています?
PCDATA - 解析済み文字データ
CDATA - (未解析) 文字データ
PCDATA はタグを解析できます。したがって、PCDATA は CDATA を解析できます。PCDATA は CDATA を理解します。また、CDATA は内部テキストをそのまま残します。つまり、CDATA は PCDATA で機能します。右?
これ
したがって、CDATA セクションにすぎないとは言えません。定義するのは #PCDATA です。そして、それは要素がその内部にパースキャリッジデータを持つことができることを示しています.
私を殺して。意味がわかりません。
ありがとう
parsing - RTF #PCDATA とドキュメント テキスト
RTF 1.9.1 仕様ドキュメントを理解しようとしていますが、#PCDATA (制御語のないテキスト) が混乱しています。以下は、私が理解していないことを示すサンプルコードです。以下のテキストの形式が正しくないことに注意してください。見栄えが良くなるように整形しました。
仕様には次のように書かれています。
文字が左中括弧 ({)、右中括弧 (})、バックスラッシュ (\)、または CRLF (キャリッジ リターン/ライン フィード) 以外の場合、リーダーはその文字がプレーン テキストであると想定し、その文字を現在のフォーマット プロパティを使用した現在の宛先。
上記の仕様に従えばTimes New Roman
、ドキュメントに書き込むことになります。パーサーは、#PCDATA またはドキュメント テキストに遭遇したかどうかをどのように知ることになっていますか?
xml - graphml ファイルを R igraph にインポートすると PCDATA 無効な char 値エラーが発生する
私の修士論文では、ネットワーク分析を行う必要があります。最初に Java を使用して、ツイート データをエッジと頂点の属性を持つエッジ リストに再構築します。
Java で作成した csv ファイルを RI にインポートした後、エッジ データから頂点データ フレームを作成し、最終的に igraph パッケージを使用してグラフを作成します。
write.graph でグラフを保存した後、後日再度インポートする必要があります。read.graph を使用すると、最初はデータが適切な UTF-8 ではないというエラー ( Graphml parse errorと同様) が発生したため、iconv() を使用してそれを防止しました。
今、私はエラーを受け取ります:
どうやら、graphml ファイルに無効な XML 文字が含まれているようです。再構築プロセス中にこれらの文字を削除するはずだった Java プログラムで replaceAll() を使用して、最初に無効な文字を防止しようとしましたが、見つかったすべての正規表現は役に立ちませんでした。1 つの式がエラーを 3 ではなく 16 の char 値に変えましたが、残念ながらもう見つけることができません。
上記のエラーをそれぞれ防止する、すべての可能な無効な文字に一致する式を教えてもらえますか?
データを再構築する Java コードは次のとおりです。
egde リストは別の方法で csv としてファイルに書き込まれますが、それを表示することはあまり重要ではありません。
エッジ リストをグラフに変換する R コード (デモンストレーションの目的のためにパスを短くしました):
エラーをスローする R スクリプト:
すでに助けてくれてありがとう!
c# - xml データは常に PCDATA ではなく CDATA として作成されます
を使用して Web サービスを作成しましたC#
が、そのメソッドの 1 つに XML を返すようにしたいと考えています。私はそうすることができましたが、すべてのデータはタグ付けされてCDATA
おり、解析されていません。それは私が探しているものではありません。
これは私のコードです:
以下は、現在の出力の例です。
これは私が達成したいものです:
だから私の質問は、CDATAタグを取り除く方法と、そもそもなぜそこにあるのかということです。
私はxmlが初めてなので、しばらくお待ちください。
xml - DTD 要素: テキストと要素の代替
XML ドキュメントの dtd を定義したいと考えています。
この dtd には、次の要素があります。
. p には、#PCDATA または別の要素 (img) を含めることができます。どうすればこれを宣言できますか? 私はこれを試しました:
しかし、それはうまくいきません。応答エラー: エラー: 「>」は予期しないトークンです。予期されるトークンは「*」です。これを試すと:
エラーが発生しました: エラー: 名前は '#' 文字、16 進値 0x23 で始めることはできません。
pにテキストまたは別の要素imgが含まれていることをどのように達成できますか? 両方のオプションが機能している必要があります。2 つのオプションのいずれかを実装する必要があります。
と
ご挨拶!