seo - robots.txt を使用してページネーションをクロールするロボットを停止するには?

Question

私のサイトにはさまざまなページネーションがあり、Google や他の検索エンジンが私のページネーションのインデックスをクロールするのを止めたいと思っています。

クロールされたページの例:

http://www.mydomain.com/explore/recently-updated/index/12

robots.txt を使用して、ロボットによる /index/ を含むページのクロールを拒否するにはどうすればよいですか?

score 3 · Accepted Answer

3

Disallow: /*?page=
Disallow: /*&page=

于 2012-09-22T10:10:24.877 に答える

score 1 · Accepted Answer

次のように、ルート Web ディレクトリに robots.txt ファイルを作成すると思います。

User-agent: *
Disallow: /explore/recently-updated/index/

それを試してから、誰か（おそらくGoogleの）ロボットチェッカーを使用して、停止していることを確認してください.

2 に答える 2