テキスト ファイルに、「I don't like this」という文字列があります。
しかし、文字列に読み込むと「I don\xe2\x80\x98t like this」となります。\u2018 が "'" の Unicode 表現であることは理解しています。私が使う
f1 = open (file1, "r")
text = f1.read()
読み取りを行うコマンド。
さて、文字列に読み込まれたときに、「I don\xe2\x80\x98t like this like this」ではなく、「I don't like this」となるような方法で文字列を読み取ることは可能ですか?
2番目の編集:この問題を解決するためにマッピングを使用する人を見てきましたが、実際には、この種の ANSI から Unicode (およびその逆) への変換を行う組み込みの変換はありませんか?