xmlファイルを作成する多言語アプリケーションがありますが、168から254までの拡張ASCII文字(¿⌐¬½¼¡«»░▓│┤╡╢╖╕╣║╗╜╛┐└┴┬├)はXMLタグでは想定されていませんそこで、ユーザーの立ち入りを制限したいと思います。
英数字、アンダースコア、ダッシュ以外のすべてを制限しようとしましたが、拡張ASCIIの一部であるアクセント付き文字を許可しませんでした。これが正規表現です"^[a-zA-Z0-9\s.\-_]+$"
2番目のオプションは、168から254までのすべての記号の文字列を作成し、文字列にそれらのいずれかが含まれているかどうかを確認することでしたが、信頼できる正確なソリューションかどうかはわかりません。
拡張ASCII文字セットの入力をフィルタリングする最良の方法は何ですか?
拡張ASCII文字セットテーブルへのリンク