Webページへの応答として奇妙な文字が表示されます。ロシア語でのメッセージだと確信していますが、コーディングはすべて奇妙なようです。Webページの情報によると、エンコーディングはISO-8859-1です。これがサンプルの応答です。
Âû ñòðàíè÷êå ïðåâüþøêàìè
この応答を復号化する方法はありますか?応答はまったく回収可能ですか。
Webページへの応答として奇妙な文字が表示されます。ロシア語でのメッセージだと確信していますが、コーディングはすべて奇妙なようです。Webページの情報によると、エンコーディングはISO-8859-1です。これがサンプルの応答です。
Âû ñòðàíè÷êå ïðåâüþøêàìè
この応答を復号化する方法はありますか?応答はまったく回収可能ですか。
エンコーディングは実際にはキリル文字のWindows-1251のようです。それに応じて、Webブラウザのエンコーディングを切り替えます。
たとえば、そのエンコーディングで指定したテキストは次のとおりです。
Выстраничкепревьюшками
自動翻訳によると、「ページのプレビュー」を意味します。
すべてのバイトの組み合わせは技術的に有効であるため、8ビットエンコーディングを自動的に認識することはほとんど不可能です。この場合、文字は非常に意味があるので、Windows-1251であると確信しています。
Выстраничкепревьюшками
明らかにISO-8859-1ではありません。
これをUnicode文字列に変換するには、次のdecode
方法を使用します。
b = "Âû ñòðàíè÷êå ïðåâüþøêàìè".encode("Latin-1") # simulate the incoming byte string
u = b.decode("Windows-1251")
print(u)