私は現在、ユーザー (メールアカウント) ごとにメールを重複排除しています。いくつかのヘッダー (メッセージ ID、件名、送信元、日付、送信先) の sha512 ハッシュを作成しています。その後、完全な電子メール (MIME 文字列) をファイルに保存し、Elasticsearch の「userID」フィールドと組み合わせてメタデータ (件名、from、to、cc ...) を挿入します。
これはユーザーごとにうまく機能していますが、グローバルに重複排除することでストレージ コストを大幅に削減できます。問題は、UserA と UserB の両方が同じメッセージを受信したときに、一部のヘッダーが異なる場合があることです。また、送信者自体のヘッダーも異なります。
これを作成する方法に関するヒントは大歓迎です。
PS 1 の解決策は、MIME ファイルをヘッダーなしで保存し、ヘッダーをユーザーごとに分けて保存することです。したがって、userA の完全な電子メールを取得するには、userA にリンクされたそのファイルのヘッダーと結合された MIME ファイルを取得します。しかし、この解決策は私にとって少し非効率的なように思えますか?