unicode - Unicodeのすべての添え字と発音区別符号の完全なリスト

Question

回答：http ：//www.unicode.org/Public/UNIDATA/UnicodeData.txtは、すべてのUnicode文字のリストであり、0xcc99＃U + 0319以下の右タックの組み合わせは、等幅フォントのコンマのようなものです。（例：10̡9̡8̡7̡6̡5̡4̡3̡2̡1̡0̡）

すべてのUnicode文字とその口頭での説明の完全なリストはありますか？たとえば、... 0xcc99＃U + 0319 COMBINING RIGHT TACK BELOW ..

_{特に、1または2 o} 3を入力するためにどの発音区別符号を使用しますか？動機は、実際に文字を追加せずに、端末の等幅フォントでポイントまたはコンマを追加できるようにすることです。

score 2 · Accepted Answer

すべての Unicode 文字の完全なリストとそれらの言語による説明はなく、Unicode 名のリストさえありません。UnicodeData.txt ファイルは、一般的に広範囲の文字を参照します。

4E00;<CJK Ideograph, First>;Lo;0;L;;;;;N;;;;;
9FCB;<CJK Ideograph, Last>;Lo;0;L;;;;;N;;;;;

と

AC00;<Hangul Syllable, First>;Lo;0;L;;;;;N;;;;;
D7A3;<Hangul Syllable, Last>;Lo;0;L;;;;;N;;;;;

Unicode 名で完全なリストを作成することは可能ですが、その目的は何でしょうか? COMBINING PALATALIZED HOOK BELOW などの Unicode 名は識別子であり、説明ではありません。英語のテキストと見なすと、直観的に説明できるものもあれば、非常に曖昧なものもあれば、あいまいなものもあれば、完全に間違っているものもあります。安定性の原則により、変更されることはありません。この原則は、プログラムで Unicode 名を使用する場合に必要となります。Unicode 番号を変更してはならないのと同じ理由で、それらを変更してはなりません。

分音符号の Unicode 名の一部も誤解を招くか、少なくとも不完全です。分音符号の形は Unicode 名だけから推測することはできず、その形は大きく異なることさえあります (たとえば、キャロン付きの t は小文字の ť で、分音記号はコンナのように見えますが、対応する大文字の Ť は.. . まあ、カロンのようなカロン）。

テキストデータで U+0319 や U+0321 などの文字を使用すると、比較的豊富なフォントと、分音記号を組み合わせて適切に表示する比較的高度なレンダリングソフトウェアが必要になることを意味します。さらに、意図されていない意味や文脈でそれらを使用する場合 (発音の特徴を示すために文字に関連付けられている音声表記で使用するためのものです)、それらを不適切に実装する貧弱なソフトウェアが必要になる場合があります (使用目的とレンダリング)。たとえば、U+0319 は文字の下に表示されるはずです

score 0 · Accepted Answer

はい、TUSに付属のCDに収録されているか、unicode.orgからダウンロードできます：Unicode文字データベース。

unicode - Unicodeのすべての添え字と発音区別符号の完全なリスト

3 に答える 3

Related

Reference