すべての Unicode 文字の完全なリストとそれらの言語による説明はなく、Unicode 名のリストさえありません。UnicodeData.txt ファイルは、一般的に広範囲の文字を参照します。
4E00;<CJK Ideograph, First>;Lo;0;L;;;;;N;;;;;
9FCB;<CJK Ideograph, Last>;Lo;0;L;;;;;N;;;;;
と
AC00;<Hangul Syllable, First>;Lo;0;L;;;;;N;;;;;
D7A3;<Hangul Syllable, Last>;Lo;0;L;;;;;N;;;;;
Unicode 名で完全なリストを作成することは可能ですが、その目的は何でしょうか? COMBINING PALATALIZED HOOK BELOW などの Unicode 名は識別子であり、説明ではありません。英語のテキストと見なすと、直観的に説明できるものもあれば、非常に曖昧なものもあれば、あいまいなものもあれば、完全に間違っているものもあります。安定性の原則により、変更されることはありません。この原則は、プログラムで Unicode 名を使用する場合に必要となります。Unicode 番号を変更してはならないのと同じ理由で、それらを変更してはなりません。
分音符号の Unicode 名の一部も誤解を招くか、少なくとも不完全です。分音符号の形は Unicode 名だけから推測することはできず、その形は大きく異なることさえあります (たとえば、キャロン付きの t は小文字の ť で、分音記号はコンナのように見えますが、対応する大文字の Ť は.. . まあ、カロンのようなカロン)。
テキスト データで U+0319 や U+0321 などの文字を使用すると、比較的豊富なフォントと、分音記号を組み合わせて適切に表示する比較的高度なレンダリング ソフトウェアが必要になることを意味します。さらに、意図されていない意味や文脈でそれらを使用する場合 (発音の特徴を示すために文字に関連付けられている音声表記で使用するためのものです)、それらを不適切に実装する貧弱なソフトウェアが必要になる場合があります (使用目的とレンダリング)。たとえば、U+0319 は文字の下に表示されるはずです