次のようなhtmlテキストがあります。
<xml ... >
そして、それを読みやすいものに変換したい:
<xml ...>
Pythonでそれを行う簡単な(そして速い)方法はありますか?
次のようなhtmlテキストがあります。
<xml ... >
そして、それを読みやすいものに変換したい:
<xml ...>
Pythonでそれを行う簡単な(そして速い)方法はありますか?
の公式ドキュメントHTMLParser
: Python 3
>>> from html import unescape
>>> unescape('© €')
© €
の公式ドキュメントHTMLParser
: Python 3
>>> from html.parser import HTMLParser
>>> pars = HTMLParser()
>>> pars.unescape('© €')
© €
注: これは を支持して廃止されましたhtml.unescape()
。
の公式ドキュメントHTMLParser
: Python 2.7
>>> import HTMLParser
>>> pars = HTMLParser.HTMLParser()
>>> pars.unescape('© €')
u'\xa9 \u20ac'
>>> print _
© €