python - Python：HTML特殊文字に変換

Question

重複の可能性：
Python 2.6でhtmlエンティティを対応するutf-8文字に置き換え
 ますPythonでHTMLをエスケープする最も簡単な方法は何ですか？

文字列をHTML文字列に簡単に変換する方法があります。たとえば、<、>などの文字を置き換え< > たり、独自の変換ルーチンを作成する必要がありますか？

score 12 · Accepted Answer

、、などの重要な特殊文字のみが気になる&場合：<>

>>> import cgi
>>> cgi.escape("<hello&goodbye>")
'&lt;hello&amp;goodbye&gt;'

その他の非ASCII文字の場合：

>>> "Übeltäter".encode("ascii", "xmlcharrefreplace")
b'&#220;belt&#228;ter'

もちろん、必要に応じて、次の2つを組み合わせることができます。

>>> cgi.escape("<Übeltäter>").encode("ascii", "xmlcharrefreplace")
b'&lt;&#220;belt&#228;ter&gt;'

1 に答える 1