トラフィックは 24 時間にわたって不均等に分散されるため、ピーク時間帯はクローラーを許可せず、混雑していない時間帯は許可したいと考えています。
これを達成する方法はありますか?
編集:すべての良いアドバイスをありがとう。
これは、私たちが見つけた別の解決策です。
2bits.com には、特定の IP アドレスからの接続数を制限するための IPTables ファイアウォールの設定に関する記事があります。
IPTables の設定:
- connlimit の使用
新しい Linux カーネルには、iptables 用の connlimit モジュールがあります。次のように使用できます。
iptables -I INPUT -p tcp -m connlimit --connlimit-above 5 -j REJECT
これにより、各 IP アドレスからの接続が最大 5 つの同時接続に制限されます。この種の「配給」接続は、クローラーが同時にサイトにアクセスするのを防ぎます。*