私の知る限り、これらはデフォルトのエンコーディングとして UTF-8 を使用するシステムでは同等であるはずです。
pattern1 = 'Wörterbuch Wortformen'.decode('utf8')
pattern2 = u'Wörterbuch Wortformen'
しかし、これらの行を Emacs バッファーから Python プロセス ( M-x python-shell-send-region
) に送信すると、奇妙なことが起こります。
>>> pattern1
u'W\xf6rterbuch Wortformen'
>>> pattern2
u'W\xc3\xb6rterbuch Wortformen'
ターミナルで実行される Python シェルでは、両方の行でu'W\xf6rterbuch Wortformen'
.
ここで何が起こっているのですか?
私のロケールは UTF-8 を使用するように設定されています。