多くの場合、特定の Unicode カテゴリ内のすべての文字を一覧表示する必要があります。例えば:
- すべての Unicode 空白を一覧表示します。Python で UTF-8 のすべての空白を取得するにはどうすればよいですか?
- プロパティを持つ文字
Alphabetic
すべての Unicode コードポイントを反復処理し、目的のカテゴリをテストすることで、このリストを作成できます (Python 3):
[c for c in map(chr, range(0x110000)) if unicodedata.category(c) in ('Ll',)]
または正規表現を使用して、
re.findall(r'\s', ''.join(map(chr, range(0x110000))))
しかし、これらの方法は遅いです。すべての文字を繰り返し処理することなく、カテゴリ内の文字のリストを検索する方法はありますか?
Perl に関する関連質問:特定のプロパティを持つすべての Unicode 文字のリストを取得するにはどうすればよいですか?