重複の可能性:
Python文字列でHTMLエンティティをデコードしますか?
"
、、、などのHTMLエスケープ文字でいっぱいの文字列があり”
ます—
。
これらのエスケープ文字をすべてそれぞれの実際の文字に置き換えるための信頼できる方法を提供するPythonライブラリはありますか?
たとえば、すべて"
のsを「s」に置き換えたいとします。
重複の可能性:
Python文字列でHTMLエンティティをデコードしますか?
"
、、、などのHTMLエスケープ文字でいっぱいの文字列があり”
ます—
。
これらのエスケープ文字をすべてそれぞれの実際の文字に置き換えるための信頼できる方法を提供するPythonライブラリはありますか?
たとえば、すべて"
のsを「s」に置き換えたいとします。
これを使用したい:
try:
from html.parser import HTMLParser # Python 3
except ModuleNotFoundError:
from HTMLParser import HTMLParser # Python 2
parser = HTMLParser()
html_decoded_string = parser.unescape(html_encoded_string)
私はまた、BeautifulSoup に対する多くの愛を感じています。
from BeautifulSoup import BeautifulSoup
html_decoded_string = BeautifulSoup(html_encoded_string, convertEntities=BeautifulSoup.HTML_ENTITIES)
また、これらの既存の質問の複製: