それらをどのように扱いますか?
4 に答える
ドメイン名では、IDN ドメインを使用できますが、登録するレジストラによってサポートされている場合です。
URL の他の場所では、通常、ブラウザーによって utf8 urlencoded として送信されます。最近、私は見ていました:
http://en.wikipedia.org/wiki/Pfeffern%C3%BCsse
そして、URL に ü が含まれているのが不思議でした。ただし、Firefox では適切な文字として表示されます。
RFC 3986 Uniform Resource Locator: General Syntaxを参照してください。これは、URL 内の非 ASCII 文字の処理方法を指定します。一般的な考え方は、各文字を UTF-8 でエンコードし、結果の各バイトを 2 桁の 16 進数値に変換し、「%」を追加することです。
もちろん、要件に応じて、URL からそれらを削除するか、アンダースコアのようなものに置き換えるだけのオプションがあります。
これらの名前の問題は、他の文字と混同されやすいことです。したがって、それらを使用するには非常に正当な理由が必要です。たとえば、会社名が「Schröder」の場合、schröder.com、schroder.com、さらには schroeder.com の両方を使用します。悪意のある名前を作成するのは簡単なので、余分なコストは正当化されます。