14

次のようなhtmlテキストがあります。

<xml ... >

そして、それを読みやすいものに変換したい:

<xml ...>

Pythonでそれを行う簡単な(そして速い)方法はありますか?

4

3 に答える 3

25

Python >= 3.4

の公式ドキュメントHTMLParser: Python 3

>>> from html import unescape
>>> unescape('&copy; &euro;')
© €

Python < 3.5

の公式ドキュメントHTMLParser: Python 3

>>> from html.parser import HTMLParser
>>> pars = HTMLParser()
>>> pars.unescape('&copy; &euro;')
© €

注: これは を支持して廃止されましたhtml.unescape()

パイソン 2.7

の公式ドキュメントHTMLParser: Python 2.7

>>> import HTMLParser
>>> pars = HTMLParser.HTMLParser()
>>> pars.unescape('&copy; &euro;')
u'\xa9 \u20ac'
>>> print _
© €
于 2009-04-08T14:36:29.350 に答える