Gmailサーバーからメールを取得するためのPythonコードをいくつか作成しました。以下のコードは次のとおりです。
self.M = imaplib.IMAP4_SSL(self.IMAP_SERVER, self.IMAP_PORT)
data = self.M.fetch(id,"(RFC822)")
if data[0] == 'OK':
msg = email.message_from_string(data[1][0][1])
else:
print 'Error!'
mail_subject = email.Header.decode_header(msg['subject'])[0][0]
print email.Header.decode_header(msg['subject'])
print '~~~separator~~~'
print mail_subject
英語のメールの件名が正しく表示されます:
[('[bonnshore.github.com] Page build successful', None)]
~~~separator~~~
[bonnshore.github.com] Page build successful
しかし、代わりに中国語の後:
[('\xd5\xe2\xca\xc7\xd6\xd0\xce\xc4\xb2\xe2\xca\xd4\xa3\xa1', 'gb2312')]
~~~separator~~~
╒Γ╩╟╓╨╬─▓Γ╩╘úí
関数isinstance()は、文字のタイプが'str'であることを示したので、これを解決しようとしました。
print unicode(mail_subject, 'gb2312')
エラーが発生します:
File "C:\Python27\lib\encodings\cp437.py", line 12, in encode
return codecs.charmap_encode(input,errors,encoding_map)
UnicodeEncodeError: 'charmap' codec can't encode characters in position 0-6:
character maps to <undefined>
また、文字を直接デコードしようとしました。
print mail_subject.decode("gb2312")
そして、私は再び同じエラーを受け取りました!
だから、これを修正する方法は?
どうもありがとう!:)