0

ここ数日、bingbot は存在​​しないページにアクセスしようとしていますが、これらのリンクの元を特定することはできませんでした。元の有効な URL の前に、ランダムなディレクトリを増やしています。例:

GET /ToWLQ/my-valid-url-here-4416.html HTTP/1.1" 404 2608 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"

My correct url is:
/my-valid-url-here-4416.html  

文字列 /XuRT/ とページは頻繁に変更されます。

多くの間違いを避けるために、htaccessを介してリダイレクトしたいと思います。

from: /ToWLQ/my-valid-url-here-4416.html  
to: /my-valid-url-here-4416.html  

ありがとうございました

ヴェラ

4

1 に答える 1

1

ここでの最良の答えは、bingbot がページの前に付けるパターンと、ページのパターンを効果的に一般化できるかどうかによって異なります。質問で提供した情報に基づいて、.htaccess で次のようなルールが機能します。

RewriteRule ^[A-Z][a-z][A-Z]+/(.*) $1 [L,R=301,QSA]

これは、最初の文字が大文字、2 番目が小文字、残りが大文字であり、その後にスラッシュが続き、実際のページであると想定しています。

EDIT : 詳細情報に基づく新しい書き換えルール:

RewriteCond %{HTTP_USER_AGENT}  (msnbot|bingbot)
RewriteRule ^([a-zA-Z]{5}/)+(.*) $2 [L,R=301,QSA]
于 2012-05-23T17:01:04.943 に答える