問題タブ [sax]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
6392 参照

java - JavaのSaxParserFactoryを構成してエンティティチェックを無効にする方法は?

さまざまなページを読み込んでデータを抽出するスクリーン スクレイピング アプリを作成しています。私はSAXParserFactorygo get aSAXParserを使用していXMLReaderます。次のように Factory を構成しました。

ただし、&nbspエンティティを含むドキュメントを解析するたびに、

工場にDTDを読まないように言ったので、エンティティが見つからないことは理解できますが、エンティティチェックをすべて無効にするにはどうすればよいですか?

編集:これは Android アプリ用です。そのため、標準環境にない API/ライブラリを使用することに消極的です。

0 投票する
1 に答える
3814 参照

python - SAX/Pythonを使用したXMLの解析+検証なし

私はPythonを初めて使用し、検証せずにSAXを使用してXMLファイルを解析しようとしています。

私のxmlファイルの先頭は次のとおりです。

そして私はそれをpython2.5.2で解析しようとしました:

しかし、エラーが発生しました:

SAXパーサーにスキーマを検索させたくありません。私はどこが間違っていますか?ありがとう !

0 投票する
4 に答える
267 参照

java - ドキュメントの構築時にJavaでxmlを検証する

私は、Excel スプレッドシートを、スキーマに対して検証する必要がある xml ドキュメントに変換することに取り組んでいます。現在、DOM API を使用して xml ドキュメントを構築しており、最後に SAX とカスタム エラー ハンドラを使用して検証しています。ただし、Excelドキュメントを解析するときに各セルから生成されたxmlを検証できるようにして、問題のあるセルをよりわかりやすい方法で示すことができるようにしたいと考えています。

私が現在直面している問題は、単純型の xml を検証した後、それらが複合型に組み込まれると、すべての子ノードが再度検証され、冗長なエラーが発生することです。

SO でこの質問を見つけましたが、C# と Microsoft API を使用しています。

考え?ありがとう!

0 投票する
1 に答える
8748 参照

java - Java: JTree で XML ファイルを表示する方法

XML ファイルの内容を .xml 形式で表示する方法が欲しいですJTree。カスタムTreeModel(およびTreeCellRenderer)を実装することにより、DOMを使用してこれをすでに達成しています。ただし、非常に扱いにくく (多くの回避策とハッカーが必要)、端がかなり荒いです。

JTreeSAXで解析されたXMLファイルの内容を表示する方法を知っている人はいますか?

ありがとう!

0 投票する
1 に答える
2011 参照

android - SAX、StringBuilder、およびメモリリーク

奇妙な問題があります。大きなテキストフィールドを持つドキュメントを解析しています。私のキャラクターセクションでは、StringBuilderを使用しています

次に、endElementで、オブジェクトの適切なフィールドに割り当てます。

setSummaryText(String text)方法は次のとおりです。

そして、私はメモリが不足しています。

setSummaryTextをこのような完全に奇妙なものに変更すると

私は元気。その参照をどこに保持しているかわからないのですか?Storyは、「」で初期化されたこのオブジェクトのメンバー変数です。注-char[]の代わりにローカル文字列変数への割り当ても失敗します。

0 投票する
2 に答える
2394 参照

java - SAX で一部の属性を読み取れない

そのドキュメントをSAXで解析しようとしています:

「initialstate」と「name」を除くすべての属性をよく読みました... startElement ハンドラーで属性を取得しましたが、scxml の属性リストのサイズはゼロです。なんで?どうすればその問題を克服できますか?

編集

これは、最初のタグを解析するときに機能しません (「null」が 2 回出力されます)。実際には、

ゼロに評価されます。

ありがとう

0 投票する
1 に答える
1018 参照

python - 停止/再開機能を備えた Lazy SAX XML パーサー

答えはノーだと確信していますが、もちろん私より賢い人もいます!

停止できる (たとえば、例外を発生させることはこれを行うための可能な方法です) だけでなく、再開可能な遅延 SAX ベースの XML パーサーを構築する方法はありますか?

標準 XML ライブラリを使用した Python >= 2.6 の解決策を探しています。「怠惰な」部分も些細なことです。私はここで「再開可能な」プロパティを本当に求めています。

0 投票する
2 に答える
18941 参照

java - SAX解析-テキストノードを取得する効率的な方法

このXMLスニペットを考えると

SAXでは、属性値を簡単に取得できます。

しかし、テキストノードの値(<author>タグの値など)を取得するのは非常に困難です...

  1. 上記のサンプルが機能しているかどうかはわかりませんが、このアプローチについてどう思いますか?
  2. もっと良い方法はありますか?(テキストノードの値を取得するため)
0 投票する
4 に答える
2940 参照

python - Pythonでxmlを非同期に処理するにはどうすればよいですか?

処理する大きなXMLデータファイル(> 160M)があり、SAX / expat/pulldom解析がその方法のようです。ノードをふるいにかけ、処理するノードをキューにプッシュするスレッドが必要です。次に、他のワーカースレッドが、次に使用可能なノードをキューからプルして処理します。

私は次のものを持っています(ロックが必要です、私は知っています-後でそうなります)

問題は、whileブロックの本体が1回だけ呼び出され、ctrl-Cでさえ中断できないことです。小さいファイルでは、出力は期待どおりですが、これは、ドキュメントが完全に解析されたときにのみハンドラーが呼び出されることを示しているようです。これは、SAXパーサーの目的を損なうようです。

それは私自身の無知だと確信していますが、どこで間違いを犯しているのかわかりません。

PS:私もstart_handlerこのように変更しようとしました:

しかし、愛はありません。

0 投票する
2 に答える
1611 参照

java - 名前空間が関係している場合に SAX 属性から値を取得する

私は SAX を使用して XML を解析しています。私のハンドラのstartElement()xsi:typeメソッドで、次のような名前の属性の値を読み取ろうとしています:

ただし、常に を返しますnull。これは他のすべてでうまく機能するので、名前空間プレフィックスが原因であると想定しています。この値を取得するにはどうすればよいですか?