yahoomailやgmailなどのサイトが、スパムとしてクリックしたメッセージをスパムフォルダに移動する方法を知りたいと思います。私に関する限り、ベイジアン分析アルゴリズムは、メッセージがコンテンツに基づいてスパムであるかどうか、またはその他の確率でメッセージをチェックします。しかし、これらのサイト(yahoomailまたはgmail)は、メッセージをあるフォルダーから別のフォルダーに動的に移行するためにどのアルゴリズムを使用しますか?
3 に答える
ほとんどのメール システムでは、特にメッセージがスパムかどうかを判断するために使用されるフィルター プログラムを挿入できます。Procmail は、おそらく、これらの中で最もよく知られているものです。基本的なプロセス:
- フィルター プログラムにメールを送信します。
- フィルタ プログラムは、スパム性をチェックし、ヘッダーや件名情報を追加します。
- ソート プログラム (procmail など) は、スパム レベルを示すヘッダー/件名情報を探します。一定のしきい値を超えた場合は、迷惑メール フォルダーに配信します。そうでない場合は、受信トレイに配信します。
procmail や他の同様のソフトウェアでも、配信やフィルタリングのタスクを自動化するためのより多くの機能が使用できることに注意してください。これはかなり些細な例です。
これは奇妙な質問ですが、文字通りの答えは、Google や Yahoo などの電子メール サービスが提供するものは、メール メッセージやフォルダを内部に保存する方法に応じて、これを異なる方法で実装するということです。たとえば、電子メール メッセージが個々のファイルとして保存され、フォルダーがディレクトリとして表される場合、電子メールをスパム フォルダーに移動することは、ファイルの名前変更/移動として行われます。一方、メールが SQL データベースに格納されている場合、あるフォルダーから別のフォルダーにメッセージを移動することは、(たとえば) メール記述子 TABLE 内の行に対する UPDATE になります。
電子メール メッセージとフォルダを表現する方法は多数ありますが、電子メール サービス プロバイダーごとに方法が異なる可能性が高く、その方法を知る方法はありません。
このプロセスを「アルゴリズム」と呼ぶのは躊躇します。確かに、表現がさまざまであり、フォルダーのモデルがさまざまであることを考えると、アルゴリズムは 1 つではありません。
あなたの質問と「java」または「javamail」タグとの間に関連性は見られません。大手プロバイダーは、電子メール サービスを Java で実装していない可能性があります。
popfile をチェックhttp://getpopfile.org/ このソフトウェアを使用すると、スパムを分類するのと同じ方法で電子メールを分類できますが、複数のフォルダに分類できます。メールを正しいフォルダに移動するだけで、学習が開始されます。
時間が経つと、メールを分類する方法を学習します。ベイジアン公式を使用して動作します。