私は再び奇妙な問題を抱えています:
特定のサイトにインデックスを付けるためのクローラーを作成しています。数週間は問題なく動作し、1時間に送信するリクエストが多すぎる場合にのみ問題が発生しました。
しかし、今では1つのページにさえアクセスできません。
しかし、さらに奇妙なことに、POSTを介していくつかのフォーム値を送信する必要がありますが、サーバーは404エラーを返します-URLは間違いなく正しいですが。
私は、ボットとして認識される蜂を防ぐために多くの手法を実装しました。ユーザーエージェントの変更、遅延、そしてフォームが自分のWebサイトから送信されたふりをするためにリファラーヘッダーを送信します。
これもまた、サーバーのスパムまたはDDOS保護である可能性がありますか?または、他に考えられるエラーの原因はありますか?