0

私はlxmlライブラリに非常に慣れていないので、今のところリンク以外を解析するのは非常に混乱しています。

ドキュメントを読みましたが、トップタグxml:lang=".."から属性の値を取得するのに苦労しています。<html ..>

その値をどのように読み取ることができますか?

例:<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-GB" lang="en">

4

1 に答える 1

1
>>> import lxml.html
>>> s = '''<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-GB" lang="en"></html>'''
>>> root = lxml.html.fromstring(s)
>>> root.get('xml:lang')
'en-GB'
于 2013-07-27T09:00:51.633 に答える