0

次の例のように、htaccessファイルに書き換えルールがあります。

     RewriteRule ^company\/([a-zA-Z0-9]+)\/(.+)$ comp_inf.php?cid=$1

     RewriteRule ^company\/([a-zA-Z0-9]+)\/img/(.*)$ ./img/$1 [L]
     RewriteRule ^company\/([a-zA-Z0-9]+)\/css/(.*)$ ./css/$1 [L]
     RewriteRule ^company\/([a-zA-Z0-9]+)\/js/(.*)$  ./js/$1  [L]     

URLリンクは次のようになります。

     http://www.example.com/company/1        

グーグル検索で、htaccessファイルで定義されていない重複ページを見つけました

そして彼らはこのように見えます:

     http://www.example.com/company/1/page1.php
     http://www.example.com/company/1/page2.php

私の質問は、これらのページのスキャンを拒否する方法と、このスキャンがこれら2つのページで特に発生する理由です。

前もって感謝します。

オファー。

4

1 に答える 1

0

まず最初に、誤ってインデックスが作成されたページを含むX-Robots noindex、nofollowヘッダーを送信する必要があります。ページがグーグルにリストされなくなったら(これをスピードアップして)、次のようなものでrobots.txtを作成できます。

User-agent: *
Disallow: /company/*/*.php

http://www.example.com/company/1/からpage1.phpまたはpage2.phpへの非絶対リンクに注意してください-例:

<a href="page1.php">anchortext</a>
于 2012-05-02T19:03:27.403 に答える