Python初心者はこちら。大きなmboxファイルを調べて、電子メールメッセージを解析したいと思います。私はそれを行うことができます:
import sys
import mailbox
def gen_summary(filename):
mbox = mailbox.mbox(filename)
for message in mbox:
subj = message['subject']
print subj
if __name__ == "__main__":
if len(sys.argv) != 2:
print 'Usage: python genarchivesum.py mbox'
sys.exit(1)
gen_summary(sys.argv[1])
しかし、もっと制御する必要があります。mboxファイルで特定の電子メールの先頭のバイト位置を取得できる必要があります。また、メッセージのバイト数(ディスクに表示されている)も取得する必要があります。そして将来的には、mboxファイルの先頭から繰り返すのではなく、特定のメッセージを探してそれを解析できるようにする必要があります(したがって、ディスク上のバイト位置を取得する必要があります)。これらは大きなmboxファイルであり、効率が問題になります。
このすべての目的は、mbox内の各電子メールに関するいくつかの小さなビットを含む要約ファイルを生成し、将来的にmbox内の個々の電子メールを効率的に検索できるようにすることです。