問題タブ [lxml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
277 参照

java - Java用のLXML Eビルダー?

私が LXML で本当に気に入っている点が 1 つあります。それは E ビルダーです。XML を次のようにまとめることができるのが気に入っています。

作る:

骨の折れる DOM の動作とは対照的です。

私はすぐに多くのソフトウェアを Java に移行しようとしていますが、E の使用法が非常に重くなっています。Java には、その使用法とほぼ同等のものがありますか?

0 投票する
1 に答える
3470 参照

python - エンティティ参照とlxml

これが私が持っているコードです:

出力は次のとおりです。

lxmlを取得して'&test;'、生のエンティティ参照を取得するにはどうすればよいですか?

0 投票する
1 に答える
119 参照

python - 要素の最初のセットを xpath と一致させる

このようなxmlドキュメントがあります。

最初のセットのみを返す xpath を作成したいと思います。

これについてはどうすればよいでしょうか?私は試してみ//bar[@type='artist']ましたが、これには他にもあることは明らかです。前もって感謝します。

0 投票する
1 に答える
3850 参照

python - lxmlを使用してxsdタイプに基づいて要素を検索する

lxml 2.xを使用して特定のxsdタイプの要素のリストを取得しようとしていますが、特定のタイプのxsdをトラバースする方法がわかりません。

スキーマの例:

xmlデータの例:

理想的な関数は次のようになります。

0 投票する
7 に答える
16621 参照

python - html5libを使用してHTMLを解析し、XPathを使用して解析したHTMLをクエリするにはどうすればよいですか?

html5libを使用して、xpathでクエリできるものにhtmlページを解析しようとしています。html5libのドキュメントはほぼゼロであり、この問題を理解するために多くの時間を費やしてきました。最終的な目標は、テーブルの2番目の行を引き出すことです。

だからそれを試してみましょう:

それはよさそうだ、私たちが他に何を持っているか見てみましょう:

笑WUT?

真剣に。xpathを使用して必要なデータを取得することを計画していましたが、うまくいかないようです。それで、なにかお手伝いできますか?私はさまざまなライブラリとアプローチを試してみようと思っています。

0 投票する
3 に答える
1786 参照

python - lxml.cssselector でインライン スタイルを見つける

このライブラリを初めて使用し (悲しいことに、BeautifulSoup にも慣れていません)、非常に単純なことをしようとしています (インライン スタイルで検索):

style="padding: 20px" のすべての tds を選択したいだけですが、理解できないようです。すべての例は、次のように td を選択する方法を示しています。

しかし、それはあまり役に立ちません。

0 投票する
4 に答える
2535 参照

python - lxml htmlを使用して、ネストされた要素から特定の要素を抽出します

こんにちはすべて私はxpathの問題に起因すると思ういくつかの問題を抱えています。lxmlパッケージのhtmlモジュールを使用して、いくつかのデータを取得しようとしています。私は以下で最も単純化された状況を提供していますが、私が使用しているhtmlははるかに醜いことを覚えておいてください。

私が本当に必要としているのは、ヘッダーテキスト「Header1」があるため、深くネストされたテーブルです。私はそのようにしようとしています:

しかし、それは私にすべてのテーブル要素を与えます。このテキストを含む1つのテーブルが必要です。私は何が起こっているのか理解していますが、いくつかの厄介な正規表現を破る以外に、これを行う方法を理解するのに苦労しています。何かご意見は?

0 投票する
1 に答える
23385 参照

python - XPath (lxml) の要素のコンテンツを一致させるにはどうすればよいですか?

XPath 式を使用して、lxml で HTML を解析したいと考えています。私の問題は、タグのコンテンツのマッチングです:

たとえば、

要素を使用して href 属性を一致させることができます

しかし、与えられた式

あるいは

lxml が「無効なノード述語」例外をスローします。

私は何を間違っていますか?

編集:

コード例:

期待される出力は「a」です。「SyntaxError: 無効なノード述語」が表示される

0 投票する
2 に答える
12777 参照

python - lxmlを使用したPythonでのエンコーディング-複雑なソリューション

lxmlを使用してWebページをダウンロードして解析し、UTF-8xml出力を作成する必要があります。擬似コードのスキーマはもっとわかりやすいと思います。

したがって、webfileは任意のエンコーディングにすることができます(lxmlがこれを処理する必要があります)。出力ファイルはutf-8である必要があります。どこでエンコーディング/コーディングを使用するかわかりません。このスキーマは大丈夫ですか?(lxmlとエンコーディングに関する優れたチュートリアルは見つかりませんが、これには多くの問題があります...)堅牢なソリューションが必要です。

編集:

したがって、utf-8をlxmlに送信するには、

0 投票する
1 に答える
253 参照

python - DreamHostにpython2.6と各種ライブラリをインストールする

このガイドに従って、DreamHostにpython2.6をインストールすることができました。「lxml」もeasy_installしようとしましたが、ひどく失敗します。

誰かがこれを達成したことがありますか?

TIA