私は単に中国語のtxtファイルをインポートしてコンテンツを印刷しようとしていました. これは、簡体字中国語のウェブからコピーしたtxtファイルの内容です:http://stock.hexun.com/2013-06-01/154742801.html
最初に、私はこれを試しました:
userinput = raw_input('Enter the name of a file')
f=open(userinput,'r')
print f.read()
f.close()
ファイルを開いて印刷することはできますが、表示される内容が文字化けしています。次に、エンコーディングで次のものを試しました:
#coding=UTF-8
userinput = raw_input('Enter the name of a file')
import codecs
f= codecs.open(userinput,"r","UTF-8")
str1=f.read()
print str1
f.close()
ただし、エラーメッセージが表示されます。UnicodeEncodeError: 'cp950 コーデックは位置 50 の文字 u'\u76d8' をエンコードできません: 不正なマルチバイト シーケンス。
なぜそのエラーが発生したのですか?それを解決する方法は?Big5、cp950 などの他のユニコードを試しましたが、まだ機能しません。