apache - htaccess書き換えルールの問題

Question

次の例のように、htaccessファイルに書き換えルールがあります。

     RewriteRule ^company\/([a-zA-Z0-9]+)\/(.+)$ comp_inf.php?cid=$1

     RewriteRule ^company\/([a-zA-Z0-9]+)\/img/(.*)$ ./img/$1 [L]
     RewriteRule ^company\/([a-zA-Z0-9]+)\/css/(.*)$ ./css/$1 [L]
     RewriteRule ^company\/([a-zA-Z0-9]+)\/js/(.*)$  ./js/$1  [L]

URLリンクは次のようになります。

     http://www.example.com/company/1

グーグル検索で、htaccessファイルで定義されていない重複ページを見つけました

そして彼らはこのように見えます：

     http://www.example.com/company/1/page1.php
     http://www.example.com/company/1/page2.php

私の質問は、これらのページのスキャンを拒否する方法と、このスキャンがこれら2つのページで特に発生する理由です。

前もって感謝します。

オファー。

score 0 · Accepted Answer

まず最初に、誤ってインデックスが作成されたページを含むX-Robots noindex、nofollowヘッダーを送信する必要があります。ページがグーグルにリストされなくなったら（これをスピードアップして）、次のようなものでrobots.txtを作成できます。

User-agent: *
Disallow: /company/*/*.php

http://www.example.com/company/1/からpage1.phpまたはpage2.phpへの非絶対リンクに注意してください-例：

<a href="page1.php">anchortext</a>

apache - htaccess書き換えルールの問題

1 に答える 1

Related

Reference