ブロックしたいと思います/products/ID/purchase
が、許可し/products/ID
ます。
最後の提案では、 「購入」で始まるページのみをブロックします。
User-agent: *
Disallow: /purchase
だから、これはあなたが望むものではありません。
2番目の提案が必要です。
User-agent: *
Disallow: /products/*/purchase
これにより、で始まり、/products/
任意の文字が続き、その後に。が続くすべてのURLがブロックされ/purchase
ます。
注:ワイルドカードを使用し*
ます。元のrobots.txtの「仕様」では、これは特別な意味を持つ文字ではありません。ただし、一部の検索エンジンは仕様を拡張し、一種のワイルドカードとして使用しています。したがって、Googleや他のいくつかの検索エンジンで機能するはずですが、他のすべてのクローラー/ボットで機能することは間違いありません。
したがって、robots.txtは次のようになります。
User-agent: *
Disallow: /sign_in
Disallow: /products/*/purchase
また、一部の検索エンジン(Googleを含む)は、robots.txtでブロックされていても、検索結果に(タイトル/スニペットなしで)URLを表示する場合があることに注意してください。これは、クロールが許可されているページでブロックされたページへのリンクを見つけた場合に当てはまる可能性があります。これを防ぐにはnoindex
、ドキュメントを作成する必要があります。