13

サイトマップ形式に関する Google ドキュメントを読みましたが、明確にされていないことが 1 つあります。検索エンジンは自動的に /sitemap_index.xml を探して見つけますか、それとも /robots.txt またはメインの/sitemap.xml? /sitemap.xmlがなくても、/sitemap_index.xml を見つけて収集することに頼ることはできますか?

4

4 に答える 4

14

robots.txt では、同じ構文を使用してサイトマップまたはサイトマップ インデックス ファイルを指定できます。

Sitemap: <location>

検索エンジンは、ファイルを見てその種類を認識します。

また、sitemap.xml と sitemap_index.xml は推奨されるファイル名にすぎないことにも注意してください。任意の名前を使用できます。robots.txt の既知の場所とは異なり、検索エンジンは、sitemap.xml や sitemap_index.xml などの場所を、その場所に何かがあることを通知しない限りチェックしません。

于 2009-03-27T17:53:28.797 に答える
7

この問題に関する多くの議論を読みましたが、Google がこれをどのように処理するかは誰も知りません。

一部の人々は、クローラーがデフォルトでこれらのファイルを探すと言います:

  • /sitemap.xml
  • /sitemap.xml.gz
  • /sitemap.gz

xml-sitemaps に関する Google の記事を読んだ場合、これらのファイル名についてよく言及されていますが、これは偶然でしょうか?

本当かもしれませんが、Google のガイドラインに従い、robots.txt を使用し、Google Webmaster Toolsからサイトマップを送信することをお勧めします。

ウェブマスター ツールは過小評価されていると思います。それは価値があり、Google から直接情報を受け取ることができ、ウェブサイトを改善するのに役立ちます。

サイトマップが更新されたときに毎回ウェブマスター ツールにログインしてサイトマップを再送信したくない場合は、Google に ping を送信して変更を知らせることができます。

Google への ping へのリンク: www.google.com/webmasters/tools/ping?sitemap=sitemap_url

詳しくはGoogle サポートをご覧ください。

于 2009-03-28T17:42:57.877 に答える
6

最善の方法は、robots.txt でサイトマップを指定することです。

Sitemap: <sitemap_location>

これについては、 www.sitemaps.orgにかなり良い説明があります。

于 2009-03-27T14:13:10.510 に答える