文字列を使って Python で作業していますが、特定の文字を正しく表示できません。
たとえば、次の文字列があります。
%23%C5%9Een%C5%9EakrakTakiple%C5%9FelimYine
私はそれにいくつかの機能を適用しましたが、役に立ちませんでした。Web サイトで適切な文字を表示するにはどうすればよいですか?
文字列を使って Python で作業していますが、特定の文字を正しく表示できません。
たとえば、次の文字列があります。
%23%C5%9Een%C5%9EakrakTakiple%C5%9FelimYine
私はそれにいくつかの機能を適用しましたが、役に立ちませんでした。Web サイトで適切な文字を表示するにはどうすればよいですか?
2つのことが必要です。最初に で urlencoded データをアンエスケープする必要がありurllib.unquote
ます。次に、バイトが入っている文字セットからバイトをデコードする必要があります。これは utf-8 のように見えます:
>>> import urllib
>>> foo = '%23%C5%9Een%C5%9EakrakTakiple%C5%9FelimYine'
>>> print urllib.unquote(foo).decode('utf-8')
#ŞenŞakrakTakipleşelimYine