問題タブ [iterparse]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

79 問題

0 投票する

1 に答える

250 参照

python - getchildren() の ElementTree インターパースの問題

特定の (しかし正しい) XML 構造がiterparse機能に影響を与える可能性があるケースを見つけました。

結果は次のとおりです。

iterparseによって提供される子ノードの数とは異なる数を返すのは奇妙に見えますparse。

xml ファイルは少し長いです (いくつかのノードを削除するiterparseと、の場合と同じ値が返されますparse):

2017-08-19T20:47:39.363

0 投票する

2 に答える

452 参照

python - すべての子孫を含む、選択した要素の Python tree.iterparse エクスポートソース XML

Python 3.4、etree.iterparse を使用して GB++ サイズの XML ウィキペディアダンプファイルを解析します。後者の値に応じて、現在一致する<page>要素内でその値をテストしたいと思います。次に、オブジェクト全体のソース XML と、その中にネストされた要素を含むすべてのコンテンツ、つまり記事全体の XML をエクスポートします。<ns><page>

オブジェクトを反復して<page>必要なものを見つけることができますが、使用可能なすべての関数がテキスト/属性値を読み取りたいように見えますが、ソースファイルの XML コードの utf8 文字列コピーがスコープ内の完全な<page>オブジェクトに必要なだけです。これは可能ですか？

XML の簡略版は次のようになります。

<ns>値テストを実行するための Python コードは次のとおりです。

この場合、2 番目の要素、つまり以下を保持する文字列のみの XML コードを抽出したいと思います。<page>

編集：マイナーなタイプミスとより良いマークアップ

python elementtree iterparse

2017-11-09T13:46:03.103

1 2 3 4 5 6 7 8 9 10

問題タブ [iterparse]

python - getchildren() の ElementTree インターパースの問題

python - すべての子孫を含む、選択した要素の Python tree.iterparse エクスポート ソース XML

Reference

python - すべての子孫を含む、選択した要素の Python tree.iterparse エクスポートソース XML