4

私はpython 2.7を使用しており、サーバーから文字列を受信して​​います(ユニコードではありません!)。その文字列の中には、Unicode エスケープ シーケンスを含むテキストがあります。たとえば、次のようにします。

<a href = "http://www.mypage.com/\u0441andmoretext">\u00b2<\a>

それらを変換するにはどうすればよい\uxxxxですか-utf-8に戻しますか? 私が見つけた答えは、私の目的には遅すぎる対処&#または必要でした。eval()このようなシーケンスを含むテキストには、普遍的なソリューションが必要です。

編集: <\a>タイプミスですが、そのようなタイプミスに対しても許容範囲が必要です。にしか反応しないはずです。\u

サンプル テキストは、次のような適切な python 構文を意味します。

"<a href = \"http://www.mypage.com/\\u0441andmoretext\">\\u00b2<\\a>"

目的の出力は適切な python 構文です

"<a href = \"http://www.mypage.com/\xd1\x81andmoretext\">\xc2\xb2<\\a>"
4

2 に答える 2