文字列を解析してアルファベットのみにしようとしているので、句読点、数字、記号などはすべて区切り記号として扱われます。ここに私の問題があります。区切る文字以外の文字がたくさんあります。
そのようなすべての文字をフィルタリングする方法はありますか? 標準の英字は 26 文字で、大文字を数えると 52 文字です。ASCII/Unicode が実際にはこのように機能しないことはわかっていますが、許可したいすべての文字を提供し、ASCII/Unicode テーブルの他のすべてを区切り文字。
だから私は尋ねていると思います、このようなことは可能ですか?65 ~ 90 および 97 ~ 122 (Unicode) の範囲外のものをすべて分離できますか?
私は現在、これを区切り文字列として使用しており、キャッチする必要がある文字のおそらく 95% をキャプチャしますが、もっと充実したものが欲しいです:
#define DELIMITERS " 0123456789<>?:,./;'[]{}-=_+\\\""