標準の AZ、az 文字だけでなく、ハイフン、全角ダッシュ、引用符などもあります。
さらに、ウムラウトなどのすべての国際文字があります。
では、英語ベースのシステムの場合、完全なセットは何でしょうか? 他の言語のセットはどうですか? UTF8、UTF16などはどうですか?
おまけの質問: 必要な名前フィールドの数と、それらの最大長はどれくらいですか?
編集:人の名前には、文脈の一部として存在するものと、構造上の理由から存在するものの 2 種類の文字が含まれていることは間違いありません。コンテキスト文字を制限したり干渉したりしたくありませんが、構造的な文字を処理する必要があります。
たとえば、全角ダッシュで区切られた名前が入ってきましたが、マイナス記号と区別するのが困難でした。システムを検索しやすくするために、5 つの異なるタイプのダッシュをすべて取得し、それらを 1 つの一意の文字 (マイナス) にマッピングします。これにより、検索者は最初にどの記号が入力されたかを具体的に知る必要がなくなります。
問題はダッシュ、おそらく引用符にも存在しますが、他の記号はいくつありますか?