この質問の受け入れられた回答を参照してください: ASP.NET - Server.HtmlEncode が名前付き文字エンティティにエンコードする文字
のソースコードをHtmlEncode
引用します。次の行に質問があります。
if ((ch >= '\x00a0') && (ch < 'Ā'))
{
output.Write("&#");
output.Write(ch.ToString(NumberFormatInfo.InvariantInfo));
output.Write(';');
}
基本的に、これは
(ASCII コード 127) から ÿ (ANSI CODE 255) までのすべての文字を、そのエンティティ エンコード表現 ( <ansicode>) に変換します。
ただし、255 を超える ansi コードを持つすべての文字は、そのまま出力に書き込まれます。
ANSI 127 - 255 のこのエンコーディングの背後にある理論的根拠を知っている人はいますか? ソースコードが次のように見えるutf-8のWebページを持つのは少しばかげているように見えます
"Søk:"
それ以外の
"Søk:"
(「Søk」はノルウェー語で「検索」を意味します)。