文字列「öçÇşŞükrÜ」を他の文字セットにデコードしています。
興味深い問題に遭遇したので、それを解決する方法を学びたいと思っています。
>>> "öçÇşŞükrÜ".decode("utf-8")
u'\xf6\xe7\xc7\u015f\u015e\xfckr\xdc'
>>> "öçÇşŞükrÜ".decode("utf-8").encode("utf-8")
'\xc3\xb6\xc3\xa7\xc3\x87\xc5\x9f\xc5\x9e\xc3\xbckr\xc3\x9c'
>>> import chardet
>>> chardet.detect('\xc3\xb6\xc3\xa7\xc3\x87\xc5\x9f\xc5\x9e\xc3\xbckr\xc3\x9c')
{'confidence': 0.99, 'encoding': 'utf-8'}
>>> chardet.detect("öçÇşŞükrÜ")
{'confidence': 0.99, 'encoding': 'utf-8'}
私が理解できず、見つけることができないのは、元の文字列「öçÇşŞükrÜ」をPythonでデコードおよびエンコードするプロセスで取得する方法です?