robots.txt を使用して、クローラーが Web ルート (私の場合は /var/www/) をクロールするのをブロックしました。/var/www/ に robots.txt があり、その中に次の行があります: Disallow /
ここで、Web ルート (/var/www/mysite.com) のサブディレクトリの 1 つがクローラーによってクロールされる必要があります。そのディレクトリに robots.txt を追加し、apache に virtualhost を追加して、この mysite.com をクロールできるようにしました。しかし、クローラーはまだ (/var/www/mysite.com) ではなく、私の Web ルート (/var/www) から robots.txt を取得しています。
助けてくれてありがとう。