私は人々がテキストを投稿できるサイトを持っています。各投稿は、投稿者の IP と投稿時刻とともにデータベースに保存されます。投稿者がボットやスパマーなどであると判断できた場合、レキャプチャを表示できるようにしたい.
これを行うのに適したアルゴリズムは何ですか? 最も簡単な選択は、事前に決められた期間 (たとえば 1 分間) の投稿数が、選択された制限 (たとえば 10) よりも多いかどうかを分析することです。ただし、これには、複数の人が同じ IP の背後から投稿するという欠点があります。 、またはランダムな頻度間隔を作成するボットでさえ > 期間、またはその期間の制限未満の投稿。
明らかに「正しい」答えはありません。ただし、一部のアルゴリズムは他のアルゴリズムよりも優れているため、最適なアルゴリズムを見つけようとしています。