私は過去にPython3.2をいじったことがありますが、今ではPythonでのutf-8エンコーディングに関してやや紛らわしい状況に直面しています。
たとえば、次のコードがあるとします。
'א'.encode()
結果はb'\xd7\x90'(または0xD790)ですが、これは間違っています。ヘブライ文字Alefのutf-8エンコーディングはであると想定されています0x5D0。
ただし、エンコーディングとしてutf-16を使用すると、プレフィックスが0xFFFE:の正しい16進値が返されます。
'א'.encode('utf-16')
これはを返しますb'\xff\xfe\xd0\x05'。
私の理解の基本的な何かが欠けているように感じます、
SOユーザー、私を教育するのを手伝ってください!