次のような非 ASCII 文字や印刷不能文字を含むユーザー入力を受け取ります。
\xc2d
\xa0
\xe7
\xc3\ufffdd
\xc3\ufffdd
\xc2\xa0
\xc3\xa7
\xa0\xa0
例えば:
email : abc@gmail.com\xa0\xa0
street : 123 Main St.\xc2\xa0
望ましい出力:
email : abc@gmail.com
street : 123 Main St.
Javaを使用してそれらを削除する最良の方法は何ですか?
次のことを試しましたが、うまくいかないようです
public static void main(String args[]) throws UnsupportedEncodingException {
String s = "abc@gmail\\xe9.com";
String email = "abc@gmail.com\\xa0\\xa0";
System.out.println(s.replaceAll("\\P{Print}", ""));
System.out.println(email.replaceAll("\\P{Print}", ""));
}
出力
abc@gmail\xe9.com
abc@gmail.com\xa0\xa0