0

私はこのHTMLコードを持っています:

<div class="row">
<span class="label">Source:</span>
08/09/2013
</div>
<div class="row">
<span class="label">Last revised:</span>
08/09/2013
</div>

次のようなコードを使用して、リリース日と最終改訂日を取得したいと思います。

url="http://web.nvd.nist.gov/view/vuln/detail?vulnId=CVE-2013-4031&cid=2"
html=urllib.urlopen(url)
parser=etree.HTMLParser()
tree=etree.parse(html,parser)
root=tree.getroot()

for div in tree.iter('div'):
 title=div.xpath('.//child::*')
 if( title[0].text=="Source:"):
  print (#release date#)

print div.text を試しましたが、うまくいきません。これどうやってするの?私はpython 2.7とlxmlを使用しています。

4

1 に答える 1