問題タブ [celementtree]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - cElementTreeでルート要素の前にxmlに処理命令を追加する
ライブラリを使用cElementTree
してxmlファイルを生成しています。.xsl
ここで、読みやすくするためにファイルを書きたいと思います。<?xml-stylesheet type="text/xsl" href="style.xsl"?>
そのため、最初のタグの前に追加する必要があります。残念ながら、最初のタグの後にのみ目的の行を入れることができました:
魔女は論理的に生成します:
私が必要とするのは:
このようなものを探していますがaddprevious
、cElementTree にはメソッドがないようです。
python - Python を使用した XML 要素の効率的な削除
サイズがかなり大きい XML ファイル (通常は 100 ~ 500 MB ですが、最大 1 GB) を効率的に編集して、特定の値を持つ属性を含まない要素をすべて削除しようとしています。速度の点でこれを実行する最も効率的な方法を探していますが、これは大きなファイルの問題であるため、大量のデータをメモリにロードしません。
XML の例を使用すると、構造は次のようになります。ここで、親要素は相互に何度でもネストすることができます。
上記の XML の例を使用して、ID が "c1" と等しくないすべての子要素を削除して、次の結果を得ようとしています。
これまでに思いついた最も効率的な方法は、cElementTree iterparse を使用することです。
上記は、サイズが 100MB のテスト ファイルを約 10 秒で処理します。これを達成するためのより効率的な方法はありますか?
python - XML を lxml で解析し、cElementTree で操作します
ファイルから大量の XML データを常に再読み込みし、操作を実行してからファイルに書き戻すアプリがあります。
lxml ライブラリは、XML の解析と解析解除ではるかに高速であることが証明されていますが、特定の種類の操作では cElementTree がはるかに高速です。どちらもほぼ同じ API を持っています。
XML ファイルを lxml で解析し、cElementTree で操作するにはどうすればよいですか?
これは私が試したことですが、lxml 解析メソッドによって生成されたオブジェクトは、本質的に独自の操作メソッドを使用します。
python - ElementTree を使用して XML を変更する
親タグ内に別の子タグを追加して、上記の XML を変更したいと考えています。私はこのようなことをしています..
これはxmlファイルを変更する正しい方法ですか? もっと良い方法はありますか?または、上記のコードで他に何を処理する必要がありますか?
python - ElementTree を使用して XML を解析しながら名前空間を操作する
これは、ElementTree を使用して XML を変更するための質問の続きです
XML に名前空間があり、「ElementTree」を介して Python で名前空間を使用して XML を解析するで答えを理解しようとしましたが、次のようになりました。
XML ファイル。
Parsing XML with namespace in Python via 'ElementTree' を見た後の私の python コード
エラーが表示されます: AttributeError: 'NoneType' object has no attribute 'findall'
python - xml の解析時にオブジェクトに属性「テキスト」がありません
ElementTree を使用して、xml の単純な文字列を解析しています。
それが根幹です。私が欲しいのは、そのタグの内容をjsonに変換することだけです。「翻訳」は xml テキストです。
単純に見えますが、「 オブジェクトに属性 'テキスト' がありません」というエラーがスローされます。私は何を間違っていますか?
python - ElementTree XML 解析と urllib2.urlopen
以下を使用して URL を開いています。
を使用するresponse.read()
と、次の出力が得られます。
しかし、ElementTree を使用して解析したい場合は、次のようになります。
次のエラーメッセージが表示されます。
しかし、行を削除するresponse.read()
と、コードは正常に機能します。私は何を間違っていますか?
python - Python 要素ツリー iterparse フィルター ノードと子
elementTree の iterparse 関数を使用して、テキストに基づいてノードをフィルタリングし、それらを新しいファイルに書き込もうとしています。入力ファイルが大きい (100 MB 以上) ため、iterparse を使用しています。
入力.xml
期待される出力 (テキストに「movie」または「film」が含まれるすべてのページ)
現在のコード
ページのテキスト属性に基づいてフィルタする正規表現を追加するにはどうすればよいですか?