Google が自分の Web サイトの PDF をインデックスに登録しないようにしたい。
Google のウェブマスター ツールで提案されているように、次の行を含めるように .htaccess ファイルを変更しました。
<Files ~ "\.pdf$">
Header set X-Robots-Tag "noindex, nofollow"
</Files>
ファイルへのアクセスを完全にブロックできるため、apache が適切に実行され、.htaccess ファイルを読み取っていることはわかっていますが、上記のコマンドが機能しているかどうかはわかりません。
Google ウェブマスター ツールは、クローラーが引き続き pdf を見ることができると主張していますが、それらは robots.txt でのみ使用することを意図しているようです。メタ タグをチェックするために使用できるサード パーティ ツール (Linux 用) はありますか?