2

これらのページを取得したとしましょう。

1. http://www.mywebsite.com/users/thomas-roberts
2. http://www.mywebsite.com/pages/thomas-roberts/1
3. http://www.mywebsite.com/pages/thomas-roberts/hello-kitty-collection

sitemap.xmlでこれを行う可能性はありますか?

<?xml version="1.0" encoding="utf-8"?>

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://mywebsite.com/users/^(\w+)$/</loc>
        <lastmod>2006-11-18</lastmod>
        <changefreq>daily</changefreq>
        <priority>1</priority>
    </url>
    <url>
        <loc>http://mywebsite.com/users/^(\w+)$/pages/^(\w+)$</loc>
        <lastmod>2006-11-18</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
    <url>
        <loc>http://mywebsite.com/users/^(\w+)$/pages/^(\d+)$</loc>
        <lastmod>2006-11-18</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.6</priority>
    </url>
</urlset>

私の例が明確であることを願っています。sitemap.xmlファイルで新しい「url」要素を実際に指定するのではなく、正規表現をurlに一致させ、毎回戻って更新します。

これが解決策ではない可能性がある場合、TwitterとFacebookはGoogleのすべてのページ(プロファイルページなど)をどのようにインデックスに登録しますか?新しいユーザーが作成されるたびに新しいサイトマップを生成し、誰かがページ/プロファイルを更新するたびにサイトマップを更新しますか?

私は非常に好奇心旺盛でした。もしインデッドがどういうわけかsitemap.xml(50.000アイテムと10mbの制限があります)を生成するようになった場合、コンテンツが変更された場合にサイトマップを生成するのは良い考えですか?

どうもありがとう。

4

3 に答える 3

3

サイトマップには実際にURLが含まれている必要があります。正規表現は、検索エンジンに何も通知しないため、受け入れられず、まったく役に立たない。

サイトマップは、検索エンジンにコンテンツの場所を指示するだけです。したがって、ページのコンテンツが変更されても、検索エンジンに関する限り、サイトマップは実際にはそのページに影響を与えません。

于 2012-08-16T14:25:33.163 に答える
0

残念ながら、サイトマップファイルには明示的なURLが必要です。Robots.txtファイルは、代わりに、URLのセットを表す*および+記号を介して特定の種類のワイルドカード構文を許可しますが、サイトマップファイルの場合はそうではありません。

于 2012-08-17T00:51:55.590 に答える
0

cronジョブで実行されているスクリプトを使用して、データベース(またはキャッシュ)のURLを更新するのが最善のアイデアだと思います。サイトマップ.xmlをサーバーの制限時間内に生成できる場合は、データを使用してオンザフライで実行します。例については、こちらをご覧ください:https ://stackoverflow.com/a/29468042/4058484

ただし、大量のデータがある場合は、robots.txtで指定されているsitemap.xmlがリストされている限り、複数のサイトマップにURLを配置するのが最適です。詳細については、 http ://www.sitemaps.org/を参照してください。 protocol.html#sitemapIndexXMLExample

于 2015-04-06T09:25:10.310 に答える