簡単なスパム フィルタを作成する必要があり、どうすればよいかよくわかりません。
これまでのところ、特定のしきい値までポイントを付与または削除する単語リストとドメイン フィルタリングを考え出しました。
たとえば、ブラックリストに登録されたドメインから「v1agr4」について書いている場合、スパムで 2 ポイントほど獲得できますが、hotmail.com アカウントから「v1agr4」について書いている場合は、1 ポイントしか獲得できません。 「スパムポイント」。
他に提案やリソースはありますか?
これは、エンタープライズ レベルの何かを開発するというよりも、スパム フィルターを学習することに関するものです。