0

これはこれに対するフォローアップの質問です: Google Analytics Character encoding of __utm cookies

次の文字列がデータストアに保存されていますdb.TextProperty- Test%D0%AFTest。これは、utf-8 でエンコードされた Cookie 値から読み取られました。

この文字列をブラウザに(逆方向のRに注意してください)として単純に出力しようとしていますTestЯTestが、代わりに表示できるのは次のとおりです。TestЯTest

あらゆる種類の Unicode、encode('utf-8')、decode('utf-8') ソリューションを試しましたが、何も機能していないようです。UnicodeDecode Errorまたは上記のテキスト を取得します。

私の HTTP ヘッダーには次の行が含まれています。Content-Type: text/html; charset=utf-8 and the HTML itself contains the meta tag: http-equiv="Content-Type" content="text/html; charset=utf-8"

何も機能していないようです。

4

1 に答える 1

0

URL の一部として保存されているため、 を使用して解析を解除する必要がありますurllib.unparse。エンコーディングについては正しい考えを持っています。URL を「解析解除」する追加の手順を実行するだけです。

>>> import urlparse
>>> s = 'Test%D0%AFTest'
>>> print urlparse.unquote(s).decode('utf8')
TestЯTest
于 2012-10-15T04:57:38.163 に答える