1
4

1 に答える 1

1

私が知っていることではありませんが、可能なエンコーディングのリストがある場合は、次のような簡単なプログラムを作成できます。

for x in ENCODINGS:
    for y in ENCODINGS:
        try:
            if 'á'.encode(x) == '‡'.encode(y):
                print(x, '→', y)
        except UnicodeError:
            pass

そうすると、元のエンコーディングは次のいずれかであるように見えます。

  • mac_arabic
  • mac_centeuro
  • mac_croatian
  • mac_farsi
  • mac_iceland
  • mac_latin2
  • mac_roman
  • mac_romanian
  • mac_turkish

誤って解釈されたエンコーディングは次のいずれかです。

  • cp1250
  • cp1251
  • cp1252
  • cp1253
  • cp1254
  • cp1255
  • cp1256
  • cp1257
  • cp1258
  • パルモス

「西部」のロケールに住んでいる場合は、mac_roman→cp1252が最も可能性が高いです。

于 2011-09-26T05:59:45.913 に答える