1

クッキーを保存するときに GA が使用するエンコーディングを把握しようとしています。たとえば、utm_source パラメータを設定するときに非西洋文字を使用すると、GA レポートに問題なく表示されます。しかし、__utmz cookie を見ると、utm_source パラメータの値と一致せず、何らかの方法でエンコードされているように見えます。URL エンコーディングがあることはわかっていますが、これは別のものです。

例:

1) www.example.com?utm_source=ХЦЧШЩЬЫЪЭЮЯにアクセス

2) クッキーを表示します。__utmz Cookie は、utm_source パラメータに与えられた値を保存します。エンコードされているように見える値ХЦЧШЩЬЫЪÐЮЯが含まれています。

3) Web サイトをクリックして、GA レポートを表示します。訪問ソースとして ХЦЧШЩЬЫЪЭЮЯ が表示されますが、これは正しいです。

__utmz Cookie を読み取って Google App Engine データストアに保存し、HTML ページに正常に表示する JavaScript を作成しようとしています。すべてのタイプのエンコード(utf-8) デコード(utf-8) ソリューションを試しましたが、何も機能していないようです。これは、Cookie を設定するときに使用した元のエンコーディングがないためだと思います。

4

1 に答える 1

2

使用されるエンコーディングはUTF-8です。ХЦЧШЩЬЫЪЭЮЯがUTF-8でエンコードされている場合、UTF-8でエンコードされた値のバイトがwindows-1252でエンコードされているかのように表示されると、ХЦЧШЩЬЫЪÐЮЯ 。たとえば、最初の文字Xであるキリル文字の大文字haはU + 0425であり、UTF-8でエンコードされた場合はバイト0xD00xA5になります。これらのバイトがwindows-1252(またはISO-8859-1)でエンコードされた文字データとして解釈される場合、それらはU + 00D0 U + 00A5、つまりÐ¥を意味します。

于 2012-10-11T04:14:53.957 に答える