問題タブ [elementtree]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PythonのElementTreeに複数のテキストノードがありますか?HTMLの生成
ElementTreeを使用してHTMLを生成していますが、ElementTreeがテキストをノードとしてではなく、のプロパティとして保存するという問題が発生しtext
ましtail
たElement
。これは、たとえば次のように、複数のテキストノードを必要とするものを生成する場合に問題になります。
私が知る限り、これを生成する方法はありません-私は何かが欠けていますか?または、Pythonですばやく簡単にHTMLを生成するためのより良いソリューションはありますか?
python - XML文字列の空白を削除します
Python 2.6でXML文字列の空白と改行を削除するにはどうすればよいですか?次のパッケージを試しました。
etree:このスニペットは元の空白を保持します:
method
パラメータを提供するPython2.7は使用できません。
ミニダム:まったく同じ:
python - ElementTreeを使用したXML読み取り
1つのxmlファイルがあります。
今、私はすべてのアイテム、itemdateなどがelementtreeを別々に使用していることを取得したいと思います。誰かが私を助けることができますか?
Rgds、
ニミー
python - PythonとElementTree:親要素を除く「内部XML」を返します
ElementTreeを使用するPython2.6では、HTMLやJavaScriptで実行できることのように、特定の要素内でXMLを(文字列として)フェッチするための良い方法は何innerHTML
ですか?
これが私が始めているXMLノードの単純化されたサンプルです:
私はこの文字列で終わりたいです:
親ノードを反復処理して子のを連結しようとしましたtostring()
が、サブノードしか得られませんでした。
正規表現を使用してソリューションをハックすることはできますが、これよりもハックが少ないものがあることを期待していました。
python - 要素ツリーインスタンスを返す方法
xmlファイルを生成したい。xml_generatorメソッドを作成しました。/ xxx urlがヒットすると、このジェネレーター関数を呼び出します。ジェネレータ関数のインスタンスを返すとエラーが発生するため、これをどのように返す必要がありますか。
python - lxmlのiterparseに複数のタグ名がありますか?
lxmlのlxml.etree.iterparseから複数のタグ名を取得する方法はありますか?高価な読み取り操作と多くのタグを持つファイルのようなオブジェクトがあるため、すべてのタグを取得するか、2つのパスを実行することは最適ではありません。
find(['tag-1', 'tag-2])
編集: iterparseの引数を除いて、BeautifulSoupのようなものになります。<td>
と<div>
タグの両方のHTMLページを解析することを想像してみてください。
python - Python ElementTree ノード/要素タイプを確認する
ElementTree を使用していますが、子ノードがテキストかどうかを判断できません。childelement.text
テキストノードではないノードでも誤検知を与えるため、機能していないようです。
助言がありますか?
例
この xml ファイルを解析した後、Python でこれを行います。
上記のコードは elem0.text を出力しません。空白です。出力に elem1.text (つまりtttttk ) が表示されます。
更新 2
私は実際に辞書を作成しています。HTML テーブルを並べ替えることができるように、それぞれの要素からのテキスト。このコードで s を取得するにはどうすればよいですか?
python - lxml / ElementTreeで連続していないテキストを取得する
lxml / ElementTreeを使用して「text2」を選択する必要があるこの種のHTMLがあるとします。
既に div 要素を mydiv として持っている場合、mydiv.text は "text1" だけを返します。
itertext() の使用は、ツリー全体を div の下で処理するため、問題があるか、せいぜい面倒に思えます。
要素から最初以外のテキスト チャンクを抽出する簡単でエレガントな方法はありますか?
python - Pythonでテキストファイルからxmlツリーを作成する
テキスト ファイルを解析するときに、xml ツリーに二重ブランチを作成しないようにする必要があります。テキストファイルが次のようになっているとします (行の順序はランダムです)。
branch1:branch11:message11
branch1:branch12:message12
branch2:branch21:message21
branch2:branch22:message22
したがって、結果の xml ツリーには、2 つのブランチを持つルートが必要です。これらのブランチには両方とも 2 つのサブブランチがあります。このテキスト ファイルを解析するために使用する Python コードは次のとおりです。
このコードの問題は、テキストファイルの各行で xml ツリーのブランチが作成されることです。
この名前のブランチが既に存在する場合、xml ツリーに別のブランチを作成しないようにする方法はありますか?
python - ElementTree 要素のインデックス検索
このxml.etree.ElementTree
モジュールを使用して、別の構造化ドキュメントから Python 3.1 で XML ドキュメントを作成しています。
既存のサブ要素のインデックスを返すには、どのElementTree
関数を使用できますか?