python - Python 2.7: 文字列内の Unicode エスケープを実際の utf-8 文字に変換する方法

翻译自：https://stackoverflow.com/questions/29805425 2015-04-22T17:55:36.250

4181 次

私はpython 2.7を使用しており、サーバーから文字列を受信しています(ユニコードではありません!)。その文字列の中には、Unicode エスケープシーケンスを含むテキストがあります。たとえば、次のようにします。

<a href = "http://www.mypage.com/\u0441andmoretext">\u00b2<\a>

それらを変換するにはどうすればよい\uxxxxですか-utf-8に戻しますか? 私が見つけた答えは、私の目的には遅すぎる対処&#または必要でした。eval()このようなシーケンスを含むテキストには、普遍的なソリューションが必要です。

編集： <\a>タイプミスですが、そのようなタイプミスに対しても許容範囲が必要です。にしか反応しないはずです。\u

サンプルテキストは、次のような適切な python 構文を意味します。

"<a href = \"http://www.mypage.com/\\u0441andmoretext\">\\u00b2<\\a>"

目的の出力は適切な python 構文です

"<a href = \"http://www.mypage.com/\xd1\x81andmoretext\">\xc2\xb2<\\a>"

2 に答える 2