7

重複の可能性:
Python文字列でHTMLエンティティをデコードしますか?

"、、、などのHTMLエスケープ文字でいっぱいの文字列があり”ます—

これらのエスケープ文字をすべてそれぞれの実際の文字に置き換えるための信頼できる方法を提供するPythonライブラリはありますか?

たとえば、すべて"のsを「s」に置き換えたいとします。

4

1 に答える 1

18

これを使用したい:

try:
    from html.parser import HTMLParser  # Python 3
except ModuleNotFoundError:
    from HTMLParser import HTMLParser  # Python 2
parser = HTMLParser()
html_decoded_string = parser.unescape(html_encoded_string)

私はまた、BeautifulSoup に対する多くの愛を感じています。

from BeautifulSoup import BeautifulSoup
html_decoded_string = BeautifulSoup(html_encoded_string, convertEntities=BeautifulSoup.HTML_ENTITIES)

また、これらの既存の質問の複製:

Python文字列でHTMLエンティティをデコードしますか?

Python で HTML エンティティをデコードする

Python で HTML エンティティをデコードする

于 2012-07-10T03:04:14.287 に答える