1 に答える
1
私が知っていることではありませんが、可能なエンコーディングのリストがある場合は、次のような簡単なプログラムを作成できます。
for x in ENCODINGS:
for y in ENCODINGS:
try:
if 'á'.encode(x) == '‡'.encode(y):
print(x, '→', y)
except UnicodeError:
pass
そうすると、元のエンコーディングは次のいずれかであるように見えます。
- mac_arabic
- mac_centeuro
- mac_croatian
- mac_farsi
- mac_iceland
- mac_latin2
- mac_roman
- mac_romanian
- mac_turkish
誤って解釈されたエンコーディングは次のいずれかです。
- cp1250
- cp1251
- cp1252
- cp1253
- cp1254
- cp1255
- cp1256
- cp1257
- cp1258
- パルモス
「西部」のロケールに住んでいる場合は、mac_roman→cp1252が最も可能性が高いです。
于 2011-09-26T05:59:45.913 に答える