Python を使用して IMAP 経由でメールをロードすることについて私が見た例では、検索を行い、結果の各メッセージ ID に対してクエリを実行します。一度に取得して高速化したい。
7818 次
2 に答える
16
RFC 3501 によると、fetch はシーケンス セットを取得しますが、その定義は見当たりませんでした。この例では、範囲形式 (2:4 = メッセージ 2、3、および 4) を使用しています。コンマで区切られたIDのリストが機能することがわかりました。imaplib を使用した python では、次のようなものがあります。
status, email_ids = con.search(None, query)
if status != 'OK':
raise Exception("Error running imap search for spinvox messages: "
"%s" % status)
fetch_ids = ','.join(email_ids[0].split())
status, data = con.fetch(fetch_ids, '(RFC822.HEADER BODY.PEEK[1])')
if status != 'OK':
raise Exception("Error running imap fetch for spinvox message: "
"%s" % status)
for i in range(len(email_ids[0].split())):
header_msg = email.message_from_string(data[i * 3 + 0][1])
subject = header_msg['Subject'],
date = header_msg['Date'],
body = data[i * 3 + 1][1] # includes some mime multipart junk
于 2010-08-27T05:57:20.177 に答える
3
これを試すと、すべてのメールのヘッダー情報を 1 回サーバーに移動するだけで取得できます。
import imaplib
import email
obj = imaplib.IMAP4_SSL('imap.gmail.com', 993)
obj.login('username', 'password')
obj.select('folder_name')
resp,data = obj.uid('FETCH', '1:*' , '(RFC822.HEADER)')
messages = [data[i][1].strip() + "\r\nSize:" + data[i][0].split()[4] + "\r\nUID:" + data[i][0].split()[2] for i in xrange(0, len(data), 2)]
for msg in messages:
msg_str = email.message_from_string(msg)
message_id = msg_str.get('Message-ID')
于 2010-09-27T10:00:18.107 に答える