問題タブ [elementtree]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
3319 参照

python - PythonのElementTreeに複数のテキストノードがありますか?HTMLの生成

ElementTreeを使用してHTMLを生成していますが、ElementTreeがテキストをノードとしてではなく、のプロパティとして保存するという問題が発生しtextましtailElement。これは、たとえば次のように、複数のテキストノードを必要とするものを生成する場合に問題になります。

私が知る限り、これを生成する方法はありません-私は何かが欠けていますか?または、Pythonですばやく簡単にHTMLを生成するためのより良いソリューションはありますか?

0 投票する
8 に答える
36934 参照

python - XML文字列の空白を削除します

Python 2.6でXML文字列の空白と改行を削除するにはどうすればよいですか?次のパッケージを試しました。

etree:このスニペットは元の空白を保持します:

methodパラメータを提供するPython2.7は使用できません。

ミニダム:まったく同じ:

0 投票する
1 に答える
398 参照

python - ElementTreeを使用したXML読み取り

1つのxmlファイルがあります。

今、私はすべてのアイテム、itemdateなどがelementtreeを別々に使用していることを取得したいと思います。誰かが私を助けることができますか?

Rgds、

ニミー

0 投票する
3 に答える
7266 参照

python - PythonとElementTree:親要素を除く「内部XML」を返します

ElementTreeを使用するPython2.6では、HTMLやJavaScriptで実行できることのように、特定の要素内でXMLを(文字列として)フェッチするための良い方法は何innerHTMLですか?

これが私が始めているXMLノードの単純化されたサンプルです:

私はこの文字列で終わりたいです:

親ノードを反復処理して子のを連結しようとしましたtostring()が、サブノードしか得られませんでした。

正規表現を使用してソリューションをハックすることはできますが、これよりもハックが少ないものがあることを期待していました。

0 投票する
1 に答える
139 参照

python - 要素ツリーインスタンスを返す方法

xmlファイルを生成したい。xml_generatorメソッドを作成しました。/ xxx urlがヒットすると、このジェネレーター関数を呼び出します。ジェネレータ関数のインスタンスを返すとエラーが発生するため、これをどのように返す必要がありますか。

0 投票する
2 に答える
2942 参照

python - lxmlのiterparseに複数のタグ名がありますか?

lxmlのlxml.etree.iterparseから複数のタグ名を取得する方法はありますか?高価な読み取り操作と多くのタグを持つファイルのようなオブジェクトがあるため、すべてのタグを取得するか、2つのパスを実行することは最適ではありません。

find(['tag-1', 'tag-2])編集: iterparseの引数を除いて、BeautifulSoupのようなものになります。<td><div>タグの両方のHTMLページを解析することを想像してみてください。

0 投票する
2 に答える
2649 参照

python - Python ElementTree ノード/要素タイプを確認する

ElementTree を使用していますが、子ノードがテキストかどうかを判断できません。childelement.textテキストノードではないノードでも誤検知を与えるため、機能していないようです。

助言がありますか?

この xml ファイルを解析した後、Python でこれを行います。

上記のコードは elem0.text を出力しません。空白です。出力に elem1.text (つまりtttttk ) が表示されます。

更新 2

私は実際に辞書を作成しています。HTML テーブルを並べ替えることができるように、それぞれの要素からのテキスト。このコードで s を取得するにはどうすればよいですか?

0 投票する
4 に答える
4219 参照

python - lxml / ElementTreeで連続していないテキストを取得する

lxml / ElementTreeを使用して「text2」を選択する必要があるこの種のHTMLがあるとします。

既に div 要素を mydiv として持っている場合、mydiv.text は "text1" だけを返します。

itertext() の使用は、ツリー全体を div の下で処理するため、問題があるか、せいぜい面倒に思えます。

要素から最初以外のテキスト チャンクを抽出する簡単でエレガントな方法はありますか?

0 投票する
2 に答える
4370 参照

python - Pythonでテキストファイルからxmlツリーを作成する

テキスト ファイルを解析するときに、xml ツリーに二重ブランチを作成しないようにする必要があります。テキストファイルが次のようになっているとします (行の順序はランダムです)。

branch1:branch11:message11
branch1:branch12:message12
branch2:branch21:message21
branch2:branch22:message22

したがって、結果の xml ツリーには、2 つのブランチを持つルートが必要です。これらのブランチには両方とも 2 つのサブブランチがあります。このテキスト ファイルを解析するために使用する Python コードは次のとおりです。

このコードの問題は、テキストファイルの各行で xml ツリーのブランチが作成されることです。

この名前のブランチが既に存在する場合、xml ツリーに別のブランチを作成しないようにする方法はありますか?

0 投票する
3 に答える
14633 参照

python - ElementTree 要素のインデックス検索

このxml.etree.ElementTreeモジュールを使用して、別の構造化ドキュメントから Python 3.1 で XML ドキュメントを作成しています。

既存のサブ要素のインデックスを返すには、どのElementTree関数を使用できますか?