oscommerceサイトを氾濫させようとしているボットを特定できるスクリプトを作成しようとしていますが、一部のボットはIPを頻繁に変更するため、IPを使用して禁止することはできません。
ボットのセッションを有効にすると、セッションIDを使用してボットをブロックできるのではないかと考えていました。
これについて調査したところ、ボットのセッションを有効にすることは推奨されていないことがわかりましたが、それでも理由がわかりません。
oscommerceサイトを氾濫させようとしているボットを特定できるスクリプトを作成しようとしていますが、一部のボットはIPを頻繁に変更するため、IPを使用して禁止することはできません。
ボットのセッションを有効にすると、セッションIDを使用してボットをブロックできるのではないかと考えていました。
これについて調査したところ、ボットのセッションを有効にすることは推奨されていないことがわかりましたが、それでも理由がわかりません。
ボットにセッションを許可する場合の問題は、悪意のあるボットがサイトでクロールするページ全体でCookieの状態を維持できない場合があることです。したがって、ボットがサイトをヒットするたびに、新しいセッションが生成されます。
ここに私が見つけたものがあります -
ほとんどのボットは Cookie の状態を保持しないため、検索ボットもセッション ID を取得し、同じページを数百回以上インデックス化する可能性があります。これは重複したコンテンツのインデックス作成を意味し、検索エンジンのランキングに深刻な影響を与える可能性があります.
ボットは設計上、Cookie ヘッダーを無視するため、後続の各要求で受信確認を送り返すことはありません。実際には、ボットのすべてのリクエストが新しいセッションを作成しています。大規模なサイトでの攻撃的なボットは、期限切れになるまでメモリ内のスペースを占有する数百、さらには数千のファントム セッションを作成する可能性があります