5
import urllib
import lxml.html
down='http://blog.sina.com.cn/s/blog_71f3890901017hof.html'
file=urllib.urlopen(down).read()
root=lxml.html.document_fromstring(file)
body=root.xpath('//div[@class="articalContent  "]')[0]
print body.text_content()

コードを実行すると、テキストコンテンツが表示されますが、テキストコンテンツではなく、そのhtmlソースコードを取得するにはどうすればよいですか?

4

1 に答える 1

6

使用する

html = lxml.html.tostring(node)

最初に使用しているツールの基本的なドキュメントをお読みください。

于 2012-12-31T07:00:06.667 に答える