4

特殊文字を含むURLがあります。例えば:

http://www.example.com/bléèàû.html

このURLをブラウザに入力すると、私のWebサーバーは正しいページを表示します(特殊文字を処理できます)。

サイトマップの仕様を確認しましたが、サイトマップファイルに特殊文字を含めることができるかどうかは不明です。私がプロトコルについて理解していることから、URLが正常に機能していて、サーバーが正しいページを提供し、XMLファイルがUTF-8でエンコードされている場合は、問題ありません。

たとえば、このエントリは有効なサイトマップエントリです。

   <url>
      <loc>http://www.example.com/bléèàû.html</loc>
      <changefreq>weekly</changefreq>
   </url>

誰でもこれを確認できますか?

[更新]特殊文字のエンコードに消極的な理由は、同じコンテンツに重複するURLを導入したくないためです。例えば

http://www.example.com/bl%C3%A9%C3%A8%C3%A0%C3%BB.html

http://www.example.com/bléèàû.html

同じページを提供します。Googleは通常のインデックスでURLとサイトマップの両方をキャッチすると思います。残念ながら、Googleは、同じページを指す重複URLを持つサイトのページランクを下げる傾向があります。

4

4 に答える 4

3

サイトマップを UTF-8 でエンコードする必要があるのは事実ですが、サイトマップに含まれる URL がすべて UTF-8 に対応しているわけではありません。

URL は、RFC 1738で指定されているように、US-ASCII のサブセットであると想定されています。あなたのURLの例は信じられません:

http://www.example.com/bléèàû.html

その参照に従って有効であり、代わりに URL エンコード/エスケープする必要があります。

于 2009-02-10T18:35:24.043 に答える
0

仕様によると、サイトマップはUTF-8 でエンコードする必要があります。URL が正しく、サイトで使用されている場合は、サイトマップに含めてください。

于 2009-02-10T18:18:00.200 に答える