問題タブ [sax]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
3001 参照

arrays - VBScript: エラー 10023 in : 配列インデックスが範囲外です (配列変数を再利用する際の問題)

Sax ActiveX スクリプティング (長い話) を使用すると、同じ return 変数を再利用する 3 つの入れ子になった if ステートメントがあります。スクリプトはおおよそ次のようになります。

奇妙なことに、これと同じコード構造が、私が先週書いたスクリプトで機能していることです。いくつかのクエリと関数の名前を変更しただけです (検索 > 置換)。

2番目のクエリの後、試してみましたMsgBox CStr(rtnArray(0)(0))が、結果が得られますError 10025 in : Array has a different number of indexes.

エラーコードは次のマニュアルに対応しています:
http://www.ftgsoftware.com/manuals/basic32.pdf

0 投票する
2 に答える
1068 参照

java - SAX パーサーを使用して XML で混合コンテンツをキャプチャする

SAX パーサーは、XML ドキュメント内の混合コンテンツをキャプチャできますか (以下の例を参照)?

<element>here is some <b>mixed content</b></element>

0 投票する
1 に答える
933 参照

android - 「»」文字のandroid Sax解析例外

こんにちは、インターネットから受け取った xml ファイルを解析するために Sax パーサーを使用しています...問題は、属性に "»" 記号を含む xml ファイルを除いて、通常の xml が正常に解析されることです...

ファイルを解析しようとするたびに、次のエラーが発生します

この文字をバイパスして、Javaコードを介して自分で処理できる方法はありますか??? 事前にサンクス...

0 投票する
1 に答える
4589 参照

python - Python SAXパーサーを使用してタグ間のテキストを取得するにはどうすればよいですか?

必要なのは、対応するタグのテキストを取得してデータベースに保持することだけです。xml ファイルが大きい (4.5 GB) ため、sax を使用しています。文字メソッドを使用してテキストを取得し、辞書に入れました。しかし、endElementメソッドでテキストを印刷すると、テキストの代わりに新しい行が表示されます。

これが私のコードです:

前もって感謝します。

0 投票する
1 に答える
1370 参照

java - SAX で一部の XML タグを無視する

Java で SAX を使用して XML ドキュメントを解析しています。
私は、さまざまな分野の研究出版物を記述する XML を扱っています。
とりわけ、研究論文の内容を簡潔に説明する「アブストラクト」などの要素があります。そのフィールドでは基本的な HTML フォーマットを使用できますが、SAX が HTML タグ (i、b、u、sub、sup など) を実際の XML タグとして脅かし、strartElement() および endElement( ) その要素のイベント。

定義済みの XML タグのセットを無視し、それらの XML コードをそのまま characters() メソッドに渡すように SAX に指示する方法はありますか?

0 投票する
4 に答える
5067 参照

java - 複数の大きな xml ファイルを 1 つに効率的にマージ

ウェブを検索し、stackoverflow を上下に検索しました。解決策はありません。純粋な xslt here内でこれを行う方法を見つけましたが。

しかし問題は、結果の xml が数百 MB の大きさになることです。したがって、これを Java の SAX で行う必要があります。(xsltでタグ付けしましたが、xsltソリューションは使用しないでください;-))

もっと詳しく説明しましょう。解析する必要がある複数の xml ファイル (InputSteam が望ましい) がいくつかあります。ファイルまたは InputStream は次のようになります

入力ストリーム1

入力ストリーム 2

inputstream1+inputstream2+...+inputstreamN =結果の xml . 次のようになります

誰かがこれに対する解決策またはリンクを持っていますか? これはカスタム InputSource を実装することで可能ですか、それともカスタム ContentHandler を使用する必要がありますか? または、これはjoost/stxで可能ですか?

ContentHandler を使用できれば、いくつかの小さな変換を適用できるという利点があります (これは既に実装しています)。しかし、問題は、複数のファイルまたは InputStream を InputSource として渡す方法がわからないことです。

または、ContentHandler 内で直接 InputStreams を解析する必要がありますか?

0 投票する
9 に答える
2696 参照

c++ - DomVsSax-Xmlの作成

SaxとDomの違いは、Xmlの解析に関してはかなり重要ですが、作成するのはどうでしょうか。Saxを使用して新しいXmlを作成する方法もありますか、またはプログラムのデータに基づいて新しいXmlファイルを作成する場合は、DOMを使用する必要がありますか?

ありがとう

0 投票する
4 に答える
6452 参照

php - PHP で不適切な形式の HTML を解析する

私のコードでは、openoffice を使用してスタイル付きの xls ドキュメントを html に変換しています。次に、を使用してテーブルを解析しxml_parser_createます。問題は、openoffice が unclosed<BR><HR>タグを含む oldschool html を作成し、doctypes を作成せず、属性を引用しないことです<TABLE WIDTH=4>

私が知っている php パーサーはこれを好まず、xml フォーマット エラーを生成します。私の現在の解決策は、ファイルを解析する前にファイルに対していくつかの正規表現を実行することですが、これはうまくも速くもありません。

この種の間違いを気にしない (できれば含まれている) php-parser を知っていますか? それとも、「壊れた」html を修正する簡単な方法でしょうか?

0 投票する
1 に答える
2617 参照

java - 入力ファイルで DTD が指定されていない場合、SAX パーサーに DTD を強制的に使用させるにはどうすればよいですか?

入力ドキュメントに doctype がなくてドキュメントを解析するときに、SAX パーサー (具体的には Java の Xerces) に DTD を使用させるにはどうすればよいですか? これは可能ですか?

私のシナリオの詳細は次のとおりです。

複数の異なるシステムによって生成された同じ DTD に準拠する XML ドキュメントが多数あります (どれも変更できません)。これらのシステムには、出力ドキュメントに Doctype を追加するものと、追加しないものがあります。名前付き文字エンティティを使用するものもあれば、使用しないものもあります。doctype を宣言せずに名前付き文字エンティティを使用するものもあります。 私はそれがコーシャではないことを知っていますが、それは私が取り組まなければならないものです.

これらのファイルを Java で解析する必要があるシステムに取り組んでいます。現在、XML ドキュメントを最初にストリームとして読み込み、Doctype が定義されているかどうかを検出し、Doctype 宣言がまだ存在しない場合は追加することで、上記のケースを処理しています。問題は、このコードにバグがあることです。よりクリーンなものに置き換えたいと考えています。

ファイルが大きいため、DOM ベースのソリューションを使用できません。また、文字エンティティを解決しようとしているので、XML スキーマを使用しても役に立ちません。

解決策がある場合は、リンクではなく直接投稿していただけませんか? 将来、リンク切れの正しい解決策がある場合、スタック オーバーフローはあまり効果がありません。