私は過去にPython3.2をいじったことがありますが、今ではPythonでのutf-8エンコーディングに関してやや紛らわしい状況に直面しています。
たとえば、次のコードがあるとします。
'א'.encode()
結果はb'\xd7\x90'
(または0xD790
)ですが、これは間違っています。ヘブライ文字Alefのutf-8エンコーディングはであると想定されています0x5D0
。
ただし、エンコーディングとしてutf-16を使用すると、プレフィックスが0xFFFE
:の正しい16進値が返されます。
'א'.encode('utf-16')
これはを返しますb'\xff\xfe\xd0\x05'
。
私の理解の基本的な何かが欠けているように感じます、
SOユーザー、私を教育するのを手伝ってください!