言語に関係なく、ユーザー名を文字と数字のみで構成したいとします。
次の正規表現パーツでこれを達成できると思います
(?>\p{L}[\p{Mn}\p{Mc}]*) //match any letter, including those consisting of two code points
\p{Nd} //match any digit
現在、ユーザーが別のユーザーと同じように見えるユーザー名を使用して、別のユーザーになりすます可能性があるという問題があります (ホモグラフ攻撃)。admin と admin がその例です。
正規表現を使用して文字と混同可能性の両方である文字を簡単に除外することはできないと思いますが、正規表現のコンテキスト外ではどうですか。コンフューザブルの Unicode ID は、フィルタリングできる特定の範囲内にあるか、またはそのようなものですか?