ウェブサイトのsitemap.xmlファイルを見つけるにはどうすればよいですか?
たとえば、stackoverflow / sitemap.xmlに移動すると、404が表示されます。
stackoverflow/robots.txtには次のように書かれています。
「これは技術的には有効ではありません。なぜなら、見捨てられた理由により、サイトマップパスは相対的ではなく絶対的でなければならないからです。サイトマップ:/sitemap.xml」
ウェブサイトのsitemap.xmlファイルを見つけるにはどうすればよいですか?
たとえば、stackoverflow / sitemap.xmlに移動すると、404が表示されます。
stackoverflow/robots.txtには次のように書かれています。
「これは技術的には有効ではありません。なぜなら、見捨てられた理由により、サイトマップパスは相対的ではなく絶対的でなければならないからです。サイトマップ:/sitemap.xml」
基準はありませんので、保証はありません。そうは言っても、サイトマップが自己ラベル付けされ、ルート上にあるのは、次のように一般的です。
example.com/sitemap.xml
一部のサーバーでは大文字と小文字が区別されるため、この点に注意してください。そこにない場合は、ルートのrobotsファイルを調べます。
example.com/robots.txt
ロボットファイルにリストされていない場合は、Googleにアクセスして検索してください。
site:example.com filetype:xml
これにより、結果がターゲットドメインのXMLファイルに制限されます。この時点で、試行錯誤し、使用しているWebサイトの詳細に基づいています。上記のGoogle検索フレーズから数ページの結果が得られた場合は、結果をさらに制限してみてください。
filetype:xml site:example.com inurl:sitemap
また
filetype:xml site:example.com inurl:products
それでも見つからない場合は、コード内にそれへの参照があるかどうかを確認するためにright-click > "View Source"
検索(別名:「controlfind」またはCtrl + F
)を実行できます。.xml
サイトマップの場所に関する基準はないと思います。これが、Googleのウェブマスターツールを使用してサイトマップを追加するときに、サイトマップに任意のURLを指定する必要がある理由です。
サイトマップの場所は、含めることができるURLに影響しますが、それ以外の場合は標準がありません。詳細については、次のリンクを参照してください: http ://www.sitemaps.org/protocol.html#location
プロトコルのドキュメントによると、ウェブサイトのデザイナーが検索エンジンにsitemap.xmlの場所を通知するために使用できるオプションは少なくとも3つあります。
したがって、robots.txtファイルでサイトマップの場所を公開することを選択しない限り、sitemap.xmlファイルをどこに配置したかを実際に知ることはできません。
あなたのためにそれを見つけるためにGoogle検索演算子を使用してください
以下のコードでグーグルを検索してください。
inurl:domain.com filetype:xml これをクリックして、サイトマップ検索の例を表示します
domain.comをサイトマップを検索するドメインに変更します。これにより、特定のドメインに対してリストされているすべてのxmlファイルがリストされます。すべてのサイトマップを含みます:)