私はDjangoチュートリアルでこの一節に出くわしました:
Djangoモデルには、unicode()を呼び出して結果をUTF-8バイト文字列に変換するデフォルトのstr()メソッドがあります。これは、unicode(p)がUnicode文字列を返し、str(p)がUTF-8としてエンコードされた文字を含む通常の文字列を返すことを意味します。
さて、afaik Unicodeは特定の表現ではないので混乱しています。では、Pythonの「Unicode文字列」とは何ですか?それはUCS-2を意味しますか?グーグルは大胆に述べているこの「PythonUnicodeチュートリアル」を見つけました
Unicodeは、世界の一般的な書記体系すべてをカバーする2バイトのエンコーディングです。
どちらが明らかに間違っているのですか、それともそれですか?私は文字セットとエンコーディングの問題で何度も混乱してきましたが、ここで私が読んでいるドキュメントは混乱していると確信しています。Pythonで「Unicode文字列」が表示されたときに何が起こっているのか誰か知っていますか?