「通常の」テストに加えて、エンコーディングもチェックするフォーム検証ユニットを作成しようとしています。
この記事http://www.w3.org/International/questions/qa-forms-utf-8によると、許可される文字は 0 ~ 31 の範囲の CR、LF、および TAB であり、DEL=127 は許可されません。
一方、0x80 ~ 0xA0 の範囲には制御文字があります。さまざまな情報源で、それらが許可されていることと許可されていないことを見てきました。また、これが XHTML、HTML、および XML で異なることも確認しました。
一部の記事で FF も許可されていると書かれていましたか?
誰かが提供できる情報源と提供できない情報源で良い答えを提供できますか?
編集: http://www.w3.org/International/questions/qa-controlsあいまいさもあります
C1範囲がサポートされています
しかし、表はそれらが違法であることを示しており、以前に示された UTF-8 検証はそれらを許可していますか?