1

シンボルへの単一のコードポイントマッピングだけで十分な場合、Unicode でシンボルの結合文字表現を使用する実用的なアプリケーションは何ですか?

プログラミング/非プログラミングのどのような利点がありますか?

4

2 に答える 2

1

U+0065 U+0065 LATIN SMALL LETTER E U+0301 COMBINING ACUTE ACCENT の代わりに U+00E9 LATIN SMALL LETTER を使用するなど、事前に構成されたプレゼンテーションが存在する場合に、分解されたプレゼンテーション (基本文字と結合文字) を使用することに特別なプログラミング上の利点はありません。 E with ACUTE “é”. このような分解されたプレゼンテーションは、利点ではなく、問題の一部であるプログラミングで対処する必要があるものです。つまり、文字コードに文字 U があることの利点について尋ねるのと似ています。

分解された表現 (または文字 U) が実際のデータで使用され、処理する必要がある理由は、プログラミングの外部にあるため、SO のトピックから外れています。

分解可能なすべての文字を分解すると、データがより均一で標準的なものになるため、処理に利点がある場合があります。これは、必要な処理のいくつかの特定の機能に関連し、(通常はライブラリ ルーチンを使用して) NFD または NFKD 形式への正規化を実行することによって実装されます。しかし、これは通常、処理の一部であり、入力形式に課せられるものではありません。文字列の一致が実行される場合、文字の分解された表現と事前に構成された表現を同等のものとして扱うことが最も望ましく、正規化によりこれが容易になります。しかし、これは 2 つの異なる表現を処理する方法であり、それらが存在する理由ではなく、NFC に正規化する (つまり、事前に構成できるものすべてを事前に構成する) ことによっても同様にうまく実行できます。Unicode FAQ セクションを参照してください正規化

于 2014-10-05T12:51:53.463 に答える