“lxml”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

277 参照

java - Java用のLXML Eビルダー?

私が LXML で本当に気に入っている点が 1 つあります。それは E ビルダーです。XML を次のようにまとめることができるのが気に入っています。

作る：

骨の折れる DOM の動作とは対照的です。

私はすぐに多くのソフトウェアを Java に移行しようとしていますが、E の使用法が非常に重くなっています。Java には、その使用法とほぼ同等のものがありますか?

2010-03-26T13:52:04.193

0 投票する

1 に答える

3470 参照

python - エンティティ参照とlxml

これが私が持っているコードです：

出力は次のとおりです。

lxmlを取得して'&test;'、生のエンティティ参照を取得するにはどうすればよいですか？

python xml lxml

2010-03-26T15:14:23.387

0 投票する

1 に答える

119 参照

python - 要素の最初のセットを xpath と一致させる

このようなxmlドキュメントがあります。

最初のセットのみを返す xpath を作成したいと思います。

これについてはどうすればよいでしょうか？私は試してみ//bar[@type='artist']ましたが、これには他にもあることは明らかです。前もって感謝します。

python xpath lxml

2010-03-26T18:05:30.060

0 投票する

1 に答える

3850 参照

python - lxmlを使用してxsdタイプに基づいて要素を検索する

lxml 2.xを使用して特定のxsdタイプの要素のリストを取得しようとしていますが、特定のタイプのxsdをトラバースする方法がわかりません。

スキーマの例：

xmlデータの例：

理想的な関数は次のようになります。

python xml xsd lxml

2010-03-30T02:49:59.777

0 投票する

7 に答える

16621 参照

python - html5libを使用してHTMLを解析し、XPathを使用して解析したHTMLをクエリするにはどうすればよいですか？

html5libを使用して、xpathでクエリできるものにhtmlページを解析しようとしています。html5libのドキュメントはほぼゼロであり、この問題を理解するために多くの時間を費やしてきました。最終的な目標は、テーブルの2番目の行を引き出すことです。

だからそれを試してみましょう：

それはよさそうだ、私たちが他に何を持っているか見てみましょう：

笑WUT？

真剣に。xpathを使用して必要なデータを取得することを計画していましたが、うまくいかないようです。それで、なにかお手伝いできますか？私はさまざまなライブラリとアプローチを試してみようと思っています。

python parsing xpath lxml html5lib

2010-04-01T04:04:03.000

0 投票する

3 に答える

1786 参照

python - lxml.cssselector でインラインスタイルを見つける

このライブラリを初めて使用し (悲しいことに、BeautifulSoup にも慣れていません)、非常に単純なことをしようとしています (インラインスタイルで検索):

style="padding: 20px" のすべての tds を選択したいだけですが、理解できないようです。すべての例は、次のように td を選択する方法を示しています。

しかし、それはあまり役に立ちません。

python lxml

2010-04-12T02:21:06.883

0 投票する

4 に答える

2535 参照

python - lxml htmlを使用して、ネストされた要素から特定の要素を抽出します

こんにちはすべて私はxpathの問題に起因すると思ういくつかの問題を抱えています。lxmlパッケージのhtmlモジュールを使用して、いくつかのデータを取得しようとしています。私は以下で最も単純化された状況を提供していますが、私が使用しているhtmlははるかに醜いことを覚えておいてください。

私が本当に必要としているのは、ヘッダーテキスト「Header1」があるため、深くネストされたテーブルです。私はそのようにしようとしています：

しかし、それは私にすべてのテーブル要素を与えます。このテキストを含む1つのテーブルが必要です。私は何が起こっているのか理解していますが、いくつかの厄介な正規表現を破る以外に、これを行う方法を理解するのに苦労しています。何かご意見は？

python html parsing xpath lxml

2010-04-14T04:40:08.410

0 投票する

1 に答える

23385 参照

python - XPath (lxml) の要素のコンテンツを一致させるにはどうすればよいですか?

XPath 式を使用して、lxml で HTML を解析したいと考えています。私の問題は、タグのコンテンツのマッチングです:

たとえば、

要素を使用して href 属性を一致させることができます

しかし、与えられた式

あるいは

lxml が「無効なノード述語」例外をスローします。

私は何を間違っていますか？

編集：

コード例:

期待される出力は「a」です。「SyntaxError: 無効なノード述語」が表示される

python xpath lxml predicate

2010-04-14T13:35:16.067

0 投票する

2 に答える

12777 参照

python - lxmlを使用したPythonでのエンコーディング-複雑なソリューション

lxmlを使用してWebページをダウンロードして解析し、UTF-8xml出力を作成する必要があります。擬似コードのスキーマはもっとわかりやすいと思います。

したがって、webfileは任意のエンコーディングにすることができます（lxmlがこれを処理する必要があります）。出力ファイルはutf-8である必要があります。どこでエンコーディング/コーディングを使用するかわかりません。このスキーマは大丈夫ですか？（lxmlとエンコーディングに関する優れたチュートリアルは見つかりませんが、これには多くの問題があります...）堅牢なソリューションが必要です。

編集：

したがって、utf-8をlxmlに送信するには、

python lxml

2010-04-21T21:30:02.390

0 投票する

1 に答える

253 参照

python - DreamHostにpython2.6と各種ライブラリをインストールする

このガイドに従って、DreamHostにpython2.6をインストールすることができました。「lxml」もeasy_installしようとしましたが、ひどく失敗します。

誰かがこれを達成したことがありますか？

TIA

python lxml dreamhost

2010-04-22T22:22:49.443

問題タブ [lxml]

Reference