utf-8 - 文字エンコーディングの相互参照

翻译自：https://stackoverflow.com/questions/7548842 2011-09-25T21:44:57.350

269 次

1 に答える 1

私が知っていることではありませんが、可能なエンコーディングのリストがある場合は、次のような簡単なプログラムを作成できます。

for x in ENCODINGS:
    for y in ENCODINGS:
        try:
            if 'á'.encode(x) == '‡'.encode(y):
                print(x, '→', y)
        except UnicodeError:
            pass

そうすると、元のエンコーディングは次のいずれかであるように見えます。

mac_arabic
mac_centeuro
mac_croatian
mac_farsi
mac_iceland
mac_latin2
mac_roman
mac_romanian
mac_turkish

誤って解釈されたエンコーディングは次のいずれかです。

cp1250
cp1251
cp1252
cp1253
cp1254
cp1255
cp1256
cp1257
cp1258
パルモス

「西部」のロケールに住んでいる場合は、mac_roman→cp1252が最も可能性が高いです。

于 2011-09-26T05:59:45.913 に答える

utf-8 - 文字エンコーディングの相互参照

1 に答える 1

Related

Reference