python - lxmlでhtmlのソースを取得する方法は？

Question

import urllib
import lxml.html
down='http://blog.sina.com.cn/s/blog_71f3890901017hof.html'
file=urllib.urlopen(down).read()
root=lxml.html.document_fromstring(file)
body=root.xpath('//div[@class="articalContent  "]')[0]
print body.text_content()

コードを実行すると、テキストコンテンツが表示されますが、テキストコンテンツではなく、そのhtmlソースコードを取得するにはどうすればよいですか？

score 6 · Accepted Answer

使用する

html = lxml.html.tostring(node)

最初に使用しているツールの基本的なドキュメントをお読みください。

python - lxmlでhtmlのソースを取得する方法は？

1 に答える 1

Related

Reference