問題タブ [xml-parsing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - 整形式でない XML を XDocument にロードする (複数の DTD)
最初に複数の DTD 宣言があることを除いて、ほぼ整形式の XHTML ドキュメントであるデータの処理に問題があります。
最初のDTDのみを使用し、残りの宣言を無視して、このデータを XDocument オブジェクトにロードする必要があります。â
ドキュメントにはなどの特殊な文字が含まれている可能性があるため、DTD 処理を完全に無視することはできません€
。
テキストは外部ソースから取得されますが、なぜこのようになるのかわかりません。
明らかに、このドキュメントを読み込もうとする単純な試みは次のように失敗しSystem.Xml.XmlException : Cannot have multiple DTDs
ます。
この種のデータを処理する最善の方法は何でしょうか?
PS: 言及するのを忘れていましたが、データはStream
文字列操作を少し複雑にする場合としない場合があります。
xml - XmlPeek タスクの使用方法
http://msdn.microsoft.com/en-us/library/ff598684(v=VS.100).aspxにあるXmlPeek タスクに関する MSDN MSBuild タスク リファレンスを読みました が、MSBuild スクリプトで使用できません。以前にこれを使用したことがある場合は、方法を教えてください。
xml-parsing - UTF-8エンコーディングを使用したXMLファイルの解析中に無効なトークンエラーが発生しました
UTF-8エンコーディングでXMLファイルを解析中に無効なトークンエラーが発生しました。
このエラーは、拡張ASCII文字'â'{"â"、"â"}が検出された場合に発生します。
エンコーディングをUTF-8からISO-8859-1に変更すると、解析は成功します。ただし、私のアプリケーションはUTF-8、ASCII、および拡張ASCII文字をサポートする必要があります。私はこれのために何をすべきですか?
どんなアイデアでも大歓迎です。
あなたの時間と解決策を事前に感謝します。
php - PHP 5.* でのメソッドのインターセプト
PHP 用のログ システムを実装していますが、少し行き詰まっています。
すべての構成は、ログに記録するすべてのメソッドを宣言する XML ファイルで定義されます。XML は適切に解析され、多次元配列 ( ) に変換されclassname => array of methods
ます。ここまでは順調ですね。
簡単な例を見てみましょう:
さて、私がこの設定ファイルを持っているとしましょう:
AT RUNTIME ONLY (XML パーサーがジョブを実行した後) で使用したいのは、次のとおりです。
ここでの大きな課題は、XML パーサーがその仕事を完了した後で、A と B を「動的」バージョンに変換することです。
理想は、A と B のコードを (ファイル内で) まったく変更せずにそれを達成することです。または、少なくとも、プログラムが終了したら元のバージョンに戻る方法を見つけることです。
明確にするために、PHP でメソッド呼び出しをインターセプトする最も適切な方法を見つけたいと考えています。
それについてあなたの考えは何ですか?
PS: そしてもちろん、クライアント コードには NO CONSEQUENCE があってはなりません (傍受が有効になっているかどうかにかかわらず違いはありません)。
c# - タグが存在しない場合に処理する GetElementByTagName はありますか
以下のコードがありますが、「serving_description」タグがない場合があります。今のところ、try catch を配置しただけですが、このシナリオを処理するためのよりクリーンな方法があるかどうかを知りたいと思っていました。
xml - XML ファイルに DOCTYPE 宣言を含めて、作業中にパーサーに削除させることはできますか?
それとも、何らかの方法でパーサーに DOCTYPE タグを無視させるのでしょうか? 「!ENTITY」として使用されている XML ファイルがあり、それ自体にも「!ENTITY」が必要であり、ネストされたファイルを最上位ファイルに含めましたが、Visual Studio は 2 番目のファイルへの参照を呼び出します。定義されていないレベルのファイル。ありがとう!
.net-2.0 - ""を含むXML文字列の解析(保存する必要があります)
string
XMLを含むコードが渡されます。 
このXMLには、 (空白文字のエンティティ参照)のインスタンスが1つ以上含まれている場合があります。これらの参照を解決しないようにする必要があります(つまり、実際のスペース文字に置き換えないでください)。
これを達成する方法はありますか?
基本的に、XMLを含む文字列が与えられた場合:
私はそれを次のように変換したくありません:
(私が実際に達成しようとしているのは、XML文字列を取得して、それを「きれいに印刷された」ファイルに書き込むことです。これには 
、文字列内の出現箇所を単一のスペース文字に解決するという副作用があります。この要件の理由は、記述されたXMLドキュメントが外部で定義された仕様に準拠している必要があるためです。)
XmlTextReader
XML文字列から読み取るサブクラスを作成してResolveEntity()
メソッドをオーバーライドしようとしましたが、これは呼び出されません。カスタムを割り当ててみましたXmlResolver
。
また、提案されているように、「ダブルエンコード」を試みました。残念ながら、パーサーによってデコードされ&
ないため、これは望ましい効果をもたらしませんでした。これが私が使用したコードです:
書かれたXMLは次のようになります。
ruby-on-rails - Nokogiri プル パーサー (Nokogiri::XML::Reader) の自己終了タグの問題
製品を含む巨大な XML (>400MB) があります。したがって、DOMパーサーを使用することは除外されているため、プルパーサーを使用して解析および処理しようとしました。each_product(&block)
以下は、製品リストを反復処理するメソッドのスニペットです。
基本的にスタックを使って、各<product> ... </product>
ノードをハッシュに変換して処理します。
<country/>
「通常の」タグと「自己終了」タグの違いがわからないため、問題は自己終了タグ(EG )にあります。どちらもタイプであり、ドキュメントNokogiri::XML::Node::ELEMENT_NODE
で他の識別子を見つけることができません。
この問題を解決する方法についてのアイデアはありますか?
objective-c - 配列の内容を確認するにはどうすればよいですか? ObjectiveC を使用した XML ファイルの解析
私は3つのクラスを持っています->
そして、アプリのデリゲートで、NSMutableArray カテゴリを定義しました。
このコードで XML ファイルを解析します。配列階層を試してみましたが、配列にオブジェクトを追加していないと思います。どうすれば確認できますか?どうしたの?
//xmlparser.h
//Video.h
//Topic.h
//Category.h
//AppDelegate
XML ファイルの短いサンプルを次に示します。
xml - XHTML の特殊文字 - 解析エラー
& のような特殊文字が xhtml にある場合、DOM/SAX パーサーは解析例外をスローします。xhtml ドキュメントは、コンポーネントの入力として取得されます。解析時にそのような特殊文字を無視したい。DOM/SAX JAVA パーサーを使用してどのように達成できますか。