3

重複の可能性:
Python 2.6でhtmlエンティティを対応するutf-8文字に置き換え
ますPythonでHTMLをエスケープする最も簡単な方法は何ですか?

文字列をHTML文字列に簡単に変換する方法があります。たとえば、<、>などの文字を置き換え&lt; &gt; たり、独自の変換ルーチンを作成する必要がありますか?

4

1 に答える 1

12

、、などの重要な特殊文字のみが気になる&場合:<>

>>> import cgi
>>> cgi.escape("<hello&goodbye>")
'&lt;hello&amp;goodbye&gt;'

その他の非ASCII文字の場合:

>>> "Übeltäter".encode("ascii", "xmlcharrefreplace")
b'&#220;belt&#228;ter'

もちろん、必要に応じて、次の2つを組み合わせることができます。

>>> cgi.escape("<Übeltäter>").encode("ascii", "xmlcharrefreplace")
b'&lt;&#220;belt&#228;ter&gt;'
于 2012-06-12T09:23:59.123 に答える