いくつかの概念を理解するのに苦労しています。Unicode 仕様には、 general categoryというプロパティがあります。
OK 文字 (通常の文字; GC=L
)、数字 (数字の 0 ~ 9 などの数値を持つその他の文字; GC=N
)、セパレータ (区切り記号; ) のそれぞれが何であるかを理解しましたGC=Z
。GC=S
しかし、記号 ( )、句読点 ( GC=P
)、マーク ( )を区別するのは非常に困難GC=M
です。
それらのリストを調べましたが、概念的な違いは見つかりませんでした。そして、このドキュメントはあまり役に立ちません。これらすべての違いは何ですか?