12

私はコードの次の部分を持っています:

In [8]: st = u"опа"

In [11]: st.encode("ascii", "xmlcharrefreplace")
Out[11]: 'опа'

In [14]: st1 = st.encode("ascii", "xmlcharrefreplace")

In [15]: st1.decode("ascii", "xmlcharrefreplace")
Out[15]: u'опа'

In [16]: st1.decode("utf-8", "xmlcharrefreplace")
Out[16]: u'опа'

st1に戻す方法を知っていますu"опа"か?

4

1 に答える 1

23

html.unescape()関数を使用します(Python 3.4 以降):

>>> import html
>>> html.unescape('опа')
'опа'

古いバージョン (Python 2 を含む) では、次のインスタンスを使用する必要がありますHTMLParser.HTMLParser()

>>> from HTMLParser import HTMLParser
>>> parser = HTMLParser()
>>> parser.unescape('опа')
u'\u043e\u043f\u0430'
>>> print parser.unescape('опа')
опа
于 2013-06-27T11:18:53.883 に答える