python - エスケープされたhtml->から通常のhtmlへ？-Python

Question

BeautifulSoupを使用して、RESTAPIを介して収集したXMLファイルを処理しました。

応答にはHTMLコードが含まれていますが、BeautifulSoupはすべてのHTMLタグをエスケープするため、適切に表示できます。

残念ながら、HTMLコードが必要です。

エスケープされたHTMLを適切なマークアップに変換するにはどうすればよいですか？

助けていただければ幸いです！

score 15 · Accepted Answer

Python標準ライブラリからxml.sax.saxutils.unescapeが必要だと思います。

例えば：

>>> from xml.sax import saxutils as su
>>> s = '&lt;foo&gt;bar&lt;/foo&gt;'
>>> su.unescape(s)
'<foo>bar</foo>'

score 2 · Accepted Answer

urllibモジュールを試すことができますか？

unquote()それはあなたのニーズに合うかもしれない方法を持っています。

編集：考え直して（そしてあなたの質問をもっと読んで）あなたはただ使いたいかもしれませんstring.replace()

そのようです：

string.replace('&lt;','<')
string.replace('&gt;','>')

2 に答える 2