私は、標準化された電子メール形式についていくつかの調査/テストを行ってきました。最終的には、アプリケーション用の電子メール パーサーを開発したいと考えています。主にメール クライアント (gmail、mac メールなど) とメール マーケティング サービス (Constant Contact、Mail Chimp など) の間で、メールの形式にいくつかの違いがあることに気付きました。
形式 ( RFC2822 ) についての私の理解は、 a\n\n
がヘッダーを本文から分離することです。これらは、電子メール マーケティング サービスから受信した電子メールと一致しているようです。ただし、電子メール クライアントには、追加のヘッダー セットまたはメッセージの指示があるようです。以下の電子メール文字列の例を参照してください。これらの文字列を電子メール パイプ経由で取得したことに注意してください。また、これらはヘッダーと本文の分割のスニペットにすぎないことに注意してください。
メールマーケティングサービス:
Content-Type: text/html;
charset="utf-8"
Content-Transfer-Encoding: 8bit
<html>
<head>
<title>Welcome to Banana Republic. Enjoy 25% off! </title>
<STYLE type="text/css">
.ReadMsgBody
{ width: 100%;}
.ExternalClass
{width: 100%;}
ここでは、ヘッダーと本文を区切る改行が表示されます。フォーマットによると、すべて良い。次に、電子メール クライアントを見てください。
メール クライアント:
Mime-Version: 1.0 (Mac OS X Mail 7.0 (1816))
X-Mailer: Apple Mail (2.1816)
--Apple-Mail=_28DD752B-7960-488D-994F-DA9408FCA880
Content-Transfer-Encoding: quoted-printable
Content-Type: text/plain;
charset=windows-1252
Testing Mac Mail. This is the body.
この場合、追加の「ヘッダー」のセットがあることがわかります。これは、この場合、Mac Mail が電子メールをどのようにフォーマットしたかについての指示のように見えます。
私の質問は、これは有効な形式ですか? それについての仕様はありますか?どのタイプのフォーマットが受信されているかを知らなくても、このタイプのフォーマットをチェックして解析するよく知られた/文書化された方法はありますか?