python - Pythonを使用してHTMLエスケープ文字を置き換えるにはどうすればよいですか？

Question

重複の可能性：
Python文字列でHTMLエンティティをデコードしますか？

"、、、などのHTMLエスケープ文字でいっぱいの文字列があり”ます—。

これらのエスケープ文字をすべてそれぞれの実際の文字に置き換えるための信頼できる方法を提供するPythonライブラリはありますか？

たとえば、すべて"のsを「s」に置き換えたいとします。

score 18 · Accepted Answer

これを使用したい：

try:
    from html.parser import HTMLParser  # Python 3
except ModuleNotFoundError:
    from HTMLParser import HTMLParser  # Python 2
parser = HTMLParser()
html_decoded_string = parser.unescape(html_encoded_string)

私はまた、BeautifulSoup に対する多くの愛を感じています。

from BeautifulSoup import BeautifulSoup
html_decoded_string = BeautifulSoup(html_encoded_string, convertEntities=BeautifulSoup.HTML_ENTITIES)

また、これらの既存の質問の複製:

Python文字列でHTMLエンティティをデコードしますか?

Python で HTML エンティティをデコードする

python - Pythonを使用してHTMLエスケープ文字を置き換えるにはどうすればよいですか？

1 に答える 1

Related

Reference