file.readline()を使用して、Pythonでルーマニア語の単語を含むファイルを読んでいます。エンコーディングが原因で多くの文字に問題があります。
例 :
>>> a = "aberație" #type 'str'
>>> a -> 'abera\xc8\x9bie'
>>> print sys.stdin.encoding
UTF-8
utf-8、cp500などでencode()を試しましたが、機能しません。
使用する必要のある正しい文字エンコードが見つかりませんか?
前もって感謝します。
編集:目的は、ファイルから単語を辞書に保存し、それを印刷するときに、「abera \ xc8 \x9bie」ではなくaberațieを取得することです。