spam-prevention - 無料のスパム対策データベースはありますか?

Question

Wordpress には、Akismet と呼ばれるスパムフィルタリングプラグインがあり、テキストのブロックをスパムかどうかに分類できるようです。唯一の注意点は、インターフェースを通過する必要があり、データベース/アルゴリズムがオープンソースではないか、他の方法ですぐに利用できないことです.

Web アプリケーションでユーザーが送信する電子メール、コメント、またはその他のテキストを分類するための Web アクセス可能な API を提供する商用プロバイダーもあります。

テキストのブロックをスパム/非スパムとして分類できるオープンソースまたは自由にアクセスできるデータベースはありますか?

編集：これが私が欲しいもののより明確な説明です

基本的に、特定のフレーズがスパムである可能性を示す大規模なデータベースがそこにあることを望んでいました. スパマーはすべての電子メールアドレスに均等にスパムを送信するので (私は推測しています)、このデータベースをベイジアンスパムフィルターに事前入力することで、ユーザートレーニングなしでほとんどのスパムをキャプチャすることから始まるアプリケーションを作成できました。

score 2 · Accepted Answer

おそらくあなたが探しているものとは正確には異なりますが、MoinMoin Wiki のメンテナーは、Wiki スパムの正規表現の中心的なリストをここに保管しています: http://master.moinmo.in/BadContent

score 1 · Accepted Answer

コメントに基づく更新:

単純なデータベースではうまくいかないと思います。ほとんどのスパムはアルゴリズムによって生成されます (たとえば、コメントスパムは通常、投稿のコンテンツを組み込みます)。Akismet は、おそらくリンク分析や既知のスパムシグネチャの使用などを組み合わせて実行しますが、公開はしません。

悪いコンテンツではなく良いコンテンツを分類する興味深い AI プロジェクトについて読んだことがあります。また、さまざまなスパムトリガー (ページの読み込み直後の応答の投稿など) に基づいてブログコメントを分析するSpam Karmaも参照してください。

元の回答 (DNS ブラックリスト):

score 1 · Accepted Answer

多分これは完全に死んだ質問かもしれませんが、これをチェックしてください: http://www.stopforumspam.com API を使用して、IP または入力されたユーザー名または電子メールを DB に対してチェックします。ただし、タイムアウトパラメータを指定して cURL を使用することをお勧めします。サービスがタイムアウトする場合としない場合があります。

spam-prevention - 無料のスパム対策データベースはありますか?

3 に答える 3

Related

Reference