0

RE検索を介して人の名前のxml Webページをスクレイピングしていますが、名前に特殊文字が含まれている場合、Pythonはそれらを正しく読み取っていません。例えば:

Güngüneş A

次のように出てきます:

G\xc3\xbcng\xc3\xbcne\xc5\x9f A

出力でこの形式を正しく作成するにはどうすればよいですか?

4

2 に答える 2

0

使用decode():

>>> b'G\xc3\xbcng\xc3\xbcne\xc5\x9f A'.decode()
'Güngüne\u015f A'

(私のマシンは 'ş' に問題があります)

于 2013-06-27T15:30:23.813 に答える