さまざまなエンコーディングで国内のいくつかの文字のコードポイントを表す整数を計算したい(これらのコーデックにはすべてそれらの文字が含まれていると確信しています)。私のプログラムは次のようになります。
characters = ['Č', 'č', 'Š', 'š', 'Ž', 'ž']
codecs = ['iso8859_2', 'cp1250', 'mac_latin2', 'utf-8', 'utf_16_le', 'utf_16_be']
for letter in characters:
for code in codecs:
print(letter + ' ' + code + ' ' + str(ord(letter.encode(code))))
出力:
Č iso8859_2 200
Č cp1250 200
Traceback (most recent call last):
File "C:/Users/Miha/Documents/2Semester/IK/Vaja2/chrEncode.py", line 7, in <module>
print(letter + ' ' + code + ' ' + str(ord(letter.encode(code))))
TypeError: ord() expected a character, but string of length 2 found
Č mac_latin2 137