可能な名には何千もの可能な文字が含まれる可能性があるため、厳密になりすぎないようにします。
通常の英語のアルファベット、アクセント付き文字、英語以外の文字、数字(??)、一般的な句読点記号
例えば
D'souza
D'Anza
M.D. Shah (dots and space)
Al-Rashid
Jatin "Tom" Shah
ただし、HTMLタグ、セミコロンなどを除外したくありません
Webアプリケーションの観点から絶対に悪いそのような文字のリストはありますか?
次に、RegExを使用してこれらの文字をブラックリストに登録できます
私のアプリケーションの背景
これは、Javaサーブレット-JSPベースのWebアプリです。バックエンドとしてMySQL(場合によってはMongoDB)を使用するLinux上のTomcat
私がこれまでに試したこと
String regex = "[^<>~@#$%;]*";
if(!fname.matches(regex))
throw new InputValidationException("Invalid FirstName")
私の質問はコーディングよりもデザインに関するものです...私はブラックリストに載せるべき文字の網羅的な(かなりの程度まで網羅的な)リストを探しています