C 拡張機能のバグにより、str インスタンスを含む Unicode データを取得しています。つまり、エンコーディングがまったくない str と Unicode リテラルを取得しています。
したがって、たとえば、これは有効な Unicode リテラルです
>>> u'\xa1Se educado!'
UTF-8 でエンコードされた str は次のようになります。
>>> '\xc2\xa1Se educado!'
ただし、ユニコードリテラルで str を取得します。
>>> '\xa1Se educado!'
そして、そこから unicode インスタンスを作成する必要があります。unicode()
エンコーディングが必要なため、使用は機能しません。私はそれ''.join(unichr(ord(x)) for x in s)
が私が必要とすることをすると思ったが、それは本当に醜い. より良い解決策が必要です。何か案は?