私はpython 2.7を使用しており、サーバーから文字列を受信しています(ユニコードではありません!)。その文字列の中には、Unicode エスケープ シーケンスを含むテキストがあります。たとえば、次のようにします。
<a href = "http://www.mypage.com/\u0441andmoretext">\u00b2<\a>
それらを変換するにはどうすればよい\uxxxx
ですか-utf-8に戻しますか? 私が見つけた答えは、私の目的には遅すぎる対処&#
または必要でした。eval()
このようなシーケンスを含むテキストには、普遍的なソリューションが必要です。
編集:
<\a>
タイプミスですが、そのようなタイプミスに対しても許容範囲が必要です。にしか反応しないはずです。\u
サンプル テキストは、次のような適切な python 構文を意味します。
"<a href = \"http://www.mypage.com/\\u0441andmoretext\">\\u00b2<\\a>"
目的の出力は適切な python 構文です
"<a href = \"http://www.mypage.com/\xd1\x81andmoretext\">\xc2\xb2<\\a>"