私のApacheログには、次のようなものがたくさんあります。
<IP ADDRESS> - - <DATE> "GET /forward?path=http://vary_bad_link_not_for_children" <NUM1> <NUM2> "-" <String>
<NUM1>: 302 または 404
<NUM2>: 5XX、6XX または 11XX
<文字列>:
「Mozilla/5.0 (互換; AhrefsBot/5.1; + http://ahrefs.com/robot/ )」
「Mozilla/5.0 (互換; MJ12bot/v1.4.5; http://www.majestic12.co.uk/bot.php?+ )」
「Mozilla/5.0 (互換; Googlebot/2.1; +...リンク)」
「Mozilla/5.0 (互換; Exabot/3.0; +...リンク)」
等...
この正規表現を使用して、fail2ban の刑務所を作成しました。
failregex = ^<HOST> .*"GET .*/forward\?path=
禁止されている IP アドレス (ログの <IP ADDRESS> を参照) が Google やその他の非常に有名な企業の IP であることを除いて、すべて正常に動作しています。
なぜこのようになっているのか、私にはよくわかりません。なぜGoogleや他の会社を禁止する必要があるのか 、そうでなければ、サーバーへの不適切なリクエストをすべて受け入れる必要があるのか.
説明が不十分だったので、質問を明確にしたいと思います。
1-Google の IP (および他の既知の企業) がこの種の「ポルノ」リクエストを行っている理由
2-「/forward?path=...」に意味はありますか?それは apache の機能ですか?
3-「良い」ボットがサイトを参照するのを止めずにこの問題を処理する方法。
助けてくれてありがとう!