0

指定されたhrefを持つhtml要素のリストを生成する作業サンプルがあります。しかし、最初の 1 つだけが必要で、速度が重要です。このコードを最適化するにはどうすればよいですか?

import lxml.html
input = """<div class="post" style="height: 36px; ">
some div text 
<a href="http://site.com/" target="_blank">Look here</a>, 
some div text also </div>
"""
root = lxml.html.fromstring(input)
el = root.xpath("//*[@href='http://site.com/']")[0]
el.text
4

2 に答える 2

0

xpath式でインデックスを使用できます。(//*[@href='http://site.com/'])[1]

于 2012-05-27T14:47:06.897 に答える
0

本当に高速であることを確認する唯一の方法は、測定、測定、測定することです。timeitモジュールが役に立ちます。

問題に戻りますが、これはどうですか?

text = root.xpath('//*[@href='http://site.com/'][1]/text()')
于 2012-07-28T09:03:38.750 に答える