重複の可能性:
Python 2.6でhtmlエンティティを対応するutf-8文字に置き換え
ますPythonでHTMLをエスケープする最も簡単な方法は何ですか?
文字列をHTML文字列に簡単に変換する方法があります。たとえば、<、>などの文字を置き換え<
>
たり、独自の変換ルーチンを作成する必要がありますか?
重複の可能性:
Python 2.6でhtmlエンティティを対応するutf-8文字に置き換え
ますPythonでHTMLをエスケープする最も簡単な方法は何ですか?
文字列をHTML文字列に簡単に変換する方法があります。たとえば、<、>などの文字を置き換え<
>
たり、独自の変換ルーチンを作成する必要がありますか?
、、などの重要な特殊文字のみが気になる&
場合:<
>
>>> import cgi
>>> cgi.escape("<hello&goodbye>")
'<hello&goodbye>'
その他の非ASCII文字の場合:
>>> "Übeltäter".encode("ascii", "xmlcharrefreplace")
b'Übeltäter'
もちろん、必要に応じて、次の2つを組み合わせることができます。
>>> cgi.escape("<Übeltäter>").encode("ascii", "xmlcharrefreplace")
b'<Übeltäter>'