1

Webページへの応答として奇妙な文字が表示されます。ロシア語でのメッセージだと確信していますが、コーディングはすべて奇妙なようです。Webページの情報によると、エンコーディングはISO-8859-1です。これがサンプルの応答です。

Âû ñòðàíè÷êå ïðåâüþøêàìè

この応答を復号化する方法はありますか?応答はまったく回収可能ですか。

4

2 に答える 2

4

エンコーディングは実際にはキリル文字のWindows-1251のようです。それに応じて、Webブラウザのエンコーディングを切り替えます。

たとえば、そのエンコーディングで指定したテキストは次のとおりです。

Выстраничкепревьюшками

自動翻訳によると、「ページのプレビュー」を意味します。

于 2011-01-28T14:15:40.377 に答える
3

すべてのバイトの組み合わせは技術的に有効であるため、8ビットエンコーディングを自動的に認識することはほとんど不可能です。この場合、文字は非常に意味があるので、Windows-1251であると確信しています。

Выстраничкепревьюшками

明らかにISO-8859-1ではありません。

これをUnicode文字列に変換するには、次のdecode方法を使用します。

b = "Âû ñòðàíè÷êå ïðåâüþøêàìè".encode("Latin-1")  # simulate the incoming byte string
u = b.decode("Windows-1251")
print(u)
于 2011-01-28T14:17:10.927 に答える