2

Google が自分の Web サイトの PDF をインデックスに登録しないようにしたい。

Google のウェブマスター ツールで提案されているように、次の行を含めるように .htaccess ファイルを変更しました。

<Files ~ "\.pdf$">   
    Header set X-Robots-Tag "noindex, nofollow" 
</Files>

ファイルへのアクセスを完全にブロックできるため、apache が適切に実行され、.htaccess ファイルを読み取っていることはわかっていますが、上記のコマンドが機能しているかどうかはわかりません。

Google ウェブマスター ツールは、クローラーが引き続き pdf を見ることができると主張していますが、それらは robots.txt でのみ使用することを意図しているようです。メタ タグをチェックするために使用できるサード パーティ ツール (Linux 用) はありますか?

4

1 に答える 1

1

一部の PDF で wget を使用して、ヘッダーを確認できます。

wget -S http://host/something.pdf
于 2012-04-12T23:07:22.203 に答える