BeautifulSoupを使用して、RESTAPIを介して収集したXMLファイルを処理しました。
応答にはHTMLコードが含まれていますが、BeautifulSoupはすべてのHTMLタグをエスケープするため、適切に表示できます。
残念ながら、HTMLコードが必要です。
エスケープされたHTMLを適切なマークアップに変換するにはどうすればよいですか?
助けていただければ幸いです!
BeautifulSoupを使用して、RESTAPIを介して収集したXMLファイルを処理しました。
応答にはHTMLコードが含まれていますが、BeautifulSoupはすべてのHTMLタグをエスケープするため、適切に表示できます。
残念ながら、HTMLコードが必要です。
エスケープされたHTMLを適切なマークアップに変換するにはどうすればよいですか?
助けていただければ幸いです!
Python標準ライブラリからxml.sax.saxutils.unescapeが必要だと思います。
例えば:
>>> from xml.sax import saxutils as su
>>> s = '<foo>bar</foo>'
>>> su.unescape(s)
'<foo>bar</foo>'
urllibモジュールを試すことができますか?
unquote()それはあなたのニーズに合うかもしれない方法を持っています。
編集:考え直して(そしてあなたの質問をもっと読んで)あなたはただ使いたいかもしれませんstring.replace()
そのようです:
string.replace('<','<')
string.replace('>','>')