私のプログラムでは、shift-jis文字コードをPython整数として取得し、対応するutf8文字コード(これも整数である必要があります)に変換する必要があります。どうやってやるの?ASCIIの場合、整数をASCII文字列に変換できる便利な関数ord()/ chr()があり、後でユニコードに簡単に変換できます。他のエンコーディングではそのようなものは見つかりません。
Python2を使用します。
編集:最終的なコード。みんな、ありがとう:
def shift_jis2unicode(charcode): # charcode is an integer
if charcode <= 0xFF:
string = chr(charcode)
else:
string = chr(charcode >> 8) + chr(charcode & 0xFF)
return ord(string.decode('shift-jis'))
print shift_jis2unicode(8140)