私のアプリケーション (C#) では、コンテンツに基づいて電子メールをフィルタリングする必要があります。電子メールがダブルオプトインの場合は、指定された電子メール アドレスに送信する必要があります。通常の電子メールの場合は、別の電子メール アドレスに送信する必要があります。
受信するメールを調べて、ダブル オプトイン メールの件名に表示される一般的な単語のリストを作成しました (最大 10 ~ 20 単語)。受信した各メールについて、件名にいくつかの単語が含まれているかどうかを確認し、件名の長さに応じて 2 ~ 3 を超える場合は、それがオプトインであると判断しました。問題は、この基本バージョンがうまく機能しなかったことです。
スパムフィルターについて読み(基本的にやりたいことは似ています)、Webでいくつかの例を検索した後、ベイジアンネットワークに基づいたものを見つけました。このソリューションの問題は、まだ持っていない多くのトレーニング資料を提供する必要があることです。
多くのトレーニング資料を必要とせずに、コンテンツと件名、または件名のみに基づいてこれらのメールをフィルタリングするにはどうすればよいですか?
編集: メール サーバー レベルでフィルタリングを行いたい。