私が書いた多くのニュースレターの説明が記載された電子メールを毎日受け取ります。メールの内容を解析して、役立つ部分を取り出してタプルに保存したいと思います。
メールの内容の例を次に示します。
「有用な情報のない冒頭の文。
(XXX 1-111)
http://the_link_for_the_resource.com
(YYY 2-222)
http://the_link_for_the_second_resource.com
..。
別の役に立たない文」
この例では、「XXX」=メーリングリスト、「1-111」=セグメント
情報をタプルに格納したい-(mailing_list、segment、url)
これを行うための最良の方法は何ですか?
編集:
サーバーからメッセージを取得するために何かを書く前に、メッセージの正確な内容を解析できるかどうかを判断したかったのです。そこで、ハッキングを開始するために、電子メールモジュールと電子メールファイルを使用して簡単なスクリプトを作成しました。コードは次のとおりです。
mail_file = open( "new_board_mail.eml"、 "r")
mail_message = email.message_from_file(mail_file)
payload = mail_message.get_payload(decode = True)
charset = mail_message.get_content_charset('iso-8859-1')
mail_content=payload。デコード(charset)
私の理解では、このコードはメッセージのコンテンツのUnicode文字列を含む`mail_content`になります。ここからコンテンツを解析するにはどうすればよいですか?