いくつかの概念を理解するのに苦労しています。Unicode 仕様には、 general categoryというプロパティがあります。
OK 文字 (通常の文字; GC=L)、数字 (数字の 0 ~ 9 などの数値を持つその他の文字; GC=N)、セパレータ (区切り記号; ) のそれぞれが何であるかを理解しましたGC=Z。GC=Sしかし、記号 ( )、句読点 ( GC=P)、マーク ( )を区別するのは非常に困難GC=Mです。
それらのリストを調べましたが、概念的な違いは見つかりませんでした。そして、このドキュメントはあまり役に立ちません。これらすべての違いは何ですか?