MBox ファイルのコレクションを解析しているときに、次の形式の Date ヘッダー フィールドが驚くほど多くあることに気付きました。
"Date:" date-time "<" addr-spec ">"
利用可能な RFC を読んでも、一致する構文が見つかりません。有効な形式は次のようです。
"Date:" date-time [CFWS]
CFWS は、RFC5322のセクション 3.3 (日付と時刻の仕様) で説明されているように、コメントと折り畳み空白を表します。
著者が132kの日付ヘッダーを分析する適切なメール日付ヘッダー形式の読み取り、それでも上記のフォームはリンクされたデータセットに表示されません。
これは、MBox アーティファクト、IMF 属性、またはメール エージェントやメール リレーによる破損ですか?
インターネット メッセージ フォーマットは 1980 年代から進化してきました。これはやや混乱しており、HTTP のようにさまざまな方法で解釈されてきました。これはベンダー固有の変更であり、不正な形式の Date ヘッダー フィールドになる傾向がありますか? IDK。
例 MBox
From ???@???
From: from@mail.com
To: to@mail.com
Date: Sat, 02 Feb 2002 00:55:01 +0000 <name@mail.com>
Subject: Email One
This is email 1.
仕様