3

いくつかの概念を理解するのに苦労しています。Unicode 仕様には、 general categoryというプロパティがあります。

OK 文字 (通常の文字; GC=L)、数字 (数字の 0 ~ 9 などの数値を持つその他の文字; GC=N)、セパレータ (区切り記号; ) のそれぞれが何であるかを理解しましたGC=ZGC=Sしかし、記号 ( )、句読点 ( GC=P)、マーク ( )を区別するのは非常に困難GC=Mです。

それらのリストを調べましたが、概念的な違いは見つかりませんでした。そして、このドキュメントはあまり役に立ちません。これらすべての違いは何ですか?

4

1 に答える 1

4

マークはスタンドアロンのキャラクターではなく、別のキャラクターに適用されます。非スペーシング マークは対象文字の上に表示され、スペーシング マークは対象文字に付随して表示され、囲みマークは対象文字の周囲に表示されます。たとえば、ボックス内の a (文字 "a" を囲む四角形文字と組み合わせたもの) は次のとおりです: a⃞</p>

句読点と記号について:リンクしたテキストで説明されているように、いくつかのエッジケースはかなり恣意的に分類されますが、原則として、句読点は「テキスト単位を整理して区切る」ために使用されることです(つまり、文の終わりをマークし、異なる文の一部、列挙などの要素を分離する) および「概念を表す」記号 (たとえば単位や数学表記など)。

于 2012-05-13T10:44:01.317 に答える