サイトマップ形式に関する Google ドキュメントを読みましたが、明確にされていないことが 1 つあります。検索エンジンは自動的に /sitemap_index.xml を探して見つけますか、それとも /robots.txt またはメインの/sitemap.xml? /sitemap.xmlがなくても、/sitemap_index.xml を見つけて収集することに頼ることはできますか?
4 に答える
robots.txt では、同じ構文を使用してサイトマップまたはサイトマップ インデックス ファイルを指定できます。
Sitemap: <location>
検索エンジンは、ファイルを見てその種類を認識します。
また、sitemap.xml と sitemap_index.xml は推奨されるファイル名にすぎないことにも注意してください。任意の名前を使用できます。robots.txt の既知の場所とは異なり、検索エンジンは、sitemap.xml や sitemap_index.xml などの場所を、その場所に何かがあることを通知しない限りチェックしません。
この問題に関する多くの議論を読みましたが、Google がこれをどのように処理するかは誰も知りません。
一部の人々は、クローラーがデフォルトでこれらのファイルを探すと言います:
- /sitemap.xml
- /sitemap.xml.gz
- /sitemap.gz
xml-sitemaps に関する Google の記事を読んだ場合、これらのファイル名についてよく言及されていますが、これは偶然でしょうか?
本当かもしれませんが、Google のガイドラインに従い、robots.txt を使用し、Google Webmaster Toolsからサイトマップを送信することをお勧めします。
ウェブマスター ツールは過小評価されていると思います。それは価値があり、Google から直接情報を受け取ることができ、ウェブサイトを改善するのに役立ちます。
サイトマップが更新されたときに毎回ウェブマスター ツールにログインしてサイトマップを再送信したくない場合は、Google に ping を送信して変更を知らせることができます。
Google への ping へのリンク: www.google.com/webmasters/tools/ping?sitemap=sitemap_url
詳しくはGoogle サポートをご覧ください。
最善の方法は、robots.txt でサイトマップを指定することです。
Sitemap: <sitemap_location>
これについては、 www.sitemaps.orgにかなり良い説明があります。