問題タブ [lxml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Java用のLXML Eビルダー?
私が LXML で本当に気に入っている点が 1 つあります。それは E ビルダーです。XML を次のようにまとめることができるのが気に入っています。
作る:
骨の折れる DOM の動作とは対照的です。
私はすぐに多くのソフトウェアを Java に移行しようとしていますが、E の使用法が非常に重くなっています。Java には、その使用法とほぼ同等のものがありますか?
python - エンティティ参照とlxml
これが私が持っているコードです:
出力は次のとおりです。
lxmlを取得して'&test;'
、生のエンティティ参照を取得するにはどうすればよいですか?
python - 要素の最初のセットを xpath と一致させる
このようなxmlドキュメントがあります。
最初のセットのみを返す xpath を作成したいと思います。
これについてはどうすればよいでしょうか?私は試してみ//bar[@type='artist']
ましたが、これには他にもあることは明らかです。前もって感謝します。
python - lxmlを使用してxsdタイプに基づいて要素を検索する
lxml 2.xを使用して特定のxsdタイプの要素のリストを取得しようとしていますが、特定のタイプのxsdをトラバースする方法がわかりません。
スキーマの例:
xmlデータの例:
理想的な関数は次のようになります。
python - html5libを使用してHTMLを解析し、XPathを使用して解析したHTMLをクエリするにはどうすればよいですか?
html5libを使用して、xpathでクエリできるものにhtmlページを解析しようとしています。html5libのドキュメントはほぼゼロであり、この問題を理解するために多くの時間を費やしてきました。最終的な目標は、テーブルの2番目の行を引き出すことです。
だからそれを試してみましょう:
それはよさそうだ、私たちが他に何を持っているか見てみましょう:
笑WUT?
真剣に。xpathを使用して必要なデータを取得することを計画していましたが、うまくいかないようです。それで、なにかお手伝いできますか?私はさまざまなライブラリとアプローチを試してみようと思っています。
python - lxml.cssselector でインライン スタイルを見つける
このライブラリを初めて使用し (悲しいことに、BeautifulSoup にも慣れていません)、非常に単純なことをしようとしています (インライン スタイルで検索):
style="padding: 20px" のすべての tds を選択したいだけですが、理解できないようです。すべての例は、次のように td を選択する方法を示しています。
しかし、それはあまり役に立ちません。
python - lxml htmlを使用して、ネストされた要素から特定の要素を抽出します
こんにちはすべて私はxpathの問題に起因すると思ういくつかの問題を抱えています。lxmlパッケージのhtmlモジュールを使用して、いくつかのデータを取得しようとしています。私は以下で最も単純化された状況を提供していますが、私が使用しているhtmlははるかに醜いことを覚えておいてください。
私が本当に必要としているのは、ヘッダーテキスト「Header1」があるため、深くネストされたテーブルです。私はそのようにしようとしています:
しかし、それは私にすべてのテーブル要素を与えます。このテキストを含む1つのテーブルが必要です。私は何が起こっているのか理解していますが、いくつかの厄介な正規表現を破る以外に、これを行う方法を理解するのに苦労しています。何かご意見は?
python - XPath (lxml) の要素のコンテンツを一致させるにはどうすればよいですか?
XPath 式を使用して、lxml で HTML を解析したいと考えています。私の問題は、タグのコンテンツのマッチングです:
たとえば、
要素を使用して href 属性を一致させることができます
しかし、与えられた式
あるいは
lxml が「無効なノード述語」例外をスローします。
私は何を間違っていますか?
編集:
コード例:
期待される出力は「a」です。「SyntaxError: 無効なノード述語」が表示される
python - lxmlを使用したPythonでのエンコーディング-複雑なソリューション
lxmlを使用してWebページをダウンロードして解析し、UTF-8xml出力を作成する必要があります。擬似コードのスキーマはもっとわかりやすいと思います。
したがって、webfileは任意のエンコーディングにすることができます(lxmlがこれを処理する必要があります)。出力ファイルはutf-8である必要があります。どこでエンコーディング/コーディングを使用するかわかりません。このスキーマは大丈夫ですか?(lxmlとエンコーディングに関する優れたチュートリアルは見つかりませんが、これには多くの問題があります...)堅牢なソリューションが必要です。
編集:
したがって、utf-8をlxmlに送信するには、
python - DreamHostにpython2.6と各種ライブラリをインストールする
このガイドに従って、DreamHostにpython2.6をインストールすることができました。「lxml」もeasy_installしようとしましたが、ひどく失敗します。
誰かがこれを達成したことがありますか?
TIA