href
URI の代わりに非 ASCII 文字を含む IRI を属性値 (属性など) として使用することは有効な HTMLですか? HTML フレーバー (HTML と XHTML、4 と 5) の間に違いはありますか? 少なくともRFC 3986は、そうではないことを暗示しているようです。
パーセントエンコーディングを使用する方が(古いIRIを認識しないソフトウェアに関して)おそらく安全であることはわかっていますが、標準に関して決定的な答えを探しています。
これまでのところ、W3C バリデーターでいくつかのテストを行いましたが、URI 内のエスケープされていない Unicode 文字は、HTML 4/5 および XHTML 4/5 doctypes で警告またはエラーをトリガーしません (もちろん、エラー メッセージがない場合は発生しません)。 t はエラーがないことを意味します)。
少なくとも chrome は未加工の UTF-8 IRI もサポートしていますが、HTTP 要求を発行する前にそれらをパーセント エスケープします。また、私の Web サーバー (lighttpd) は、HTTP 要求で UTF-8 文字をパーセント エンコードされた形式とエンコードされていない形式でサポートしているようです。