1

私が書いた多くのニュースレターの説明が記載された電子メールを毎日受け取ります。メールの内容を解析して、役立つ部分を取り出してタプルに保存したいと思います。

メールの内容の例を次に示します。


「有用な情報のない冒頭の文。

(XXX 1-111)

http://the_link_for_the_resource.com

(YYY 2-222)

http://the_link_for_the_second_resource.com

..。

別の役に立たない文」


この例では、「XXX」=メーリングリスト、「1-111」=セグメント

情報をタプルに格納したい-(mailing_list、segment、url)

これを行うための最良の方法は何ですか?

編集:

サーバーからメッセージを取得するために何かを書く前に、メッセージの正確な内容を解析できるかどうかを判断したかったのです。そこで、ハッキングを開始するために、電子メールモジュールと電子メールファイルを使用して簡単なスクリプトを作成しました。コードは次のとおりです。


mail_file = open( "new_board_mail.eml"、 "r")
mail_message = email.message_from_file(mail_file)
payload = mail_message.get_payload(decode = True)
charset = mail_message.get_content_charset('iso-8859-1')
mail_content=payload。デコード(charset)

私の理解では、このコードはメッセージのコンテンツのUnicode文字列を含む`mail_content`になります。ここからコンテンツを解析するにはどうすればよいですか?

4

1 に答える 1

0

Pythonを使用している場合は、imaplibモジュールを使用してメールボックスに接続し、特定の電子メールを検索して(特定のアドレスから送信されているか、件名が識別可能であると想定)、内容を解析することをお勧めします。

于 2012-10-18T03:26:39.187 に答える