2

メインドメインにリンクしているグーグルインデックスからサブドメインを削除する方法を教えてもらえますか?

私のドメインがwww.myweb.comで、私のサブドメインがcdn.myweb.comだとします。ここで、サブドメインのドキュメントルートはメインドメインと同じです。そのため、robot.txtを使用してGoogleのインデックス作成を停止することはできませんでした。これにより、メインドメインリンクのインデックス作成も削除されます。

私はグーグル、ビング、スタックオーバーフローも検索しましたが、質問に対する完璧な答えを見つけることができませんでした。あなたの側から解決するものはありますか?

4

3 に答える 3

4

この目的のために動的robots.txtを使用できます。このようなもの...

httpd.conf(.htaccess):

RewriteRule /robots\.txt$ /var/www/myweb/robots.php

robots.php:

<?php
header('Content-type: text/plain');

if($_SERVER['HTTP_HOST']=='cdn.myweb.com'){ 
    echo "User-agent: *\n";
    echo "Disallow: /\n";
}else{              
    include("./robots.txt");    
}
于 2013-02-18T12:25:46.877 に答える
2

私はnginxを使用しており、同じサーバーブロックに複数のサブドメインがあります。wwwサブドメインをGoogleのインデックスに含め、残りのサブドメインを除外したいのですが。

まず、nginx構成のサーバーブロックに、ドメインに応じて/robots.txtで2つの異なるファイルを提供するために以下を追加しました。

location ~ /robots.txt {
    if ($host = 'www.example.com') {
      rewrite ^/robots\.txt /robots.www.txt last;
    }
  }

次に、私のサイトのルートディレクトリに、次の2つのファイルがあります。

  • クロールをブロックし、すべてのサブドメインのデフォルトであるrobots.txt
# Do not crawl subdomain
User-Agent: *
Disallow: /
  • robots.www.txtは、すべてのサイトのクロールを可能にし、www.example.com /robots.txtでのみ提供されます。
User-agent: *
Disallow:
于 2013-02-21T11:25:52.227 に答える
0

最初にrobots.txtを追加しますが、私の場合、私のページはすでにCDNサブドメインでインデックスに登録されているため、ロボットには遅すぎました。私が見つけた最善の方法は、Googleウェブマスターツールにアクセスして、cdnドメイン(cdn.mysite.com)を追加することでした。次に、Googleインデックス-> URLの削除に移動し、/ urlを削除しました。有効になるまでに数日かかりました。

于 2013-10-09T22:12:37.277 に答える