特殊文字を含むURLがあります。例えば:
http://www.example.com/bléèàû.html
このURLをブラウザに入力すると、私のWebサーバーは正しいページを表示します(特殊文字を処理できます)。
サイトマップの仕様を確認しましたが、サイトマップファイルに特殊文字を含めることができるかどうかは不明です。私がプロトコルについて理解していることから、URLが正常に機能していて、サーバーが正しいページを提供し、XMLファイルがUTF-8でエンコードされている場合は、問題ありません。
たとえば、このエントリは有効なサイトマップエントリです。
<url>
<loc>http://www.example.com/bléèàû.html</loc>
<changefreq>weekly</changefreq>
</url>
誰でもこれを確認できますか?
[更新]特殊文字のエンコードに消極的な理由は、同じコンテンツに重複するURLを導入したくないためです。例えば
http://www.example.com/bl%C3%A9%C3%A8%C3%A0%C3%BB.html
と
http://www.example.com/bléèàû.html
同じページを提供します。Googleは通常のインデックスでURLとサイトマップの両方をキャッチすると思います。残念ながら、Googleは、同じページを指す重複URLを持つサイトのページランクを下げる傾向があります。