2

「実生活」でラテン小文字 C (U+0368)の組み合わせに遭遇する可能性はどのくらいですか (賢いスコットランド人を除く)?

Unicode Block Combining Diacritical MarksCategory Mark, Nonspacing [Mn]の両方にあるので、私は尋ねています。

その結果、 ICU Transliteratorなどのユーティリティ(提案された音訳またはストレートな音訳を使用) では、 COMBINING GRAVE ACCENT (U+0300)などの文字と同じように扱われるようです。"NFD; [:Nonspacing Mark:] Remove; NFC""Latin-ASCII"

4

2 に答える 2

2

発生しないと予想している場合は発生するということを除いて、確率はまったく不確定です。

于 2013-03-06T18:05:02.783 に答える
2

可能性はゼロに非常に近いですが、完全にゼロではありません。誰もが Unicode 文字を好きなように使用するのを防ぐことはできません。Unicode 規格には U+0368 に関する具体的な情報はありませんが、前の文字の上に記号 (c) が表示される組み合わせ文字として定義されていることは間違いありません。主にデジタル化された中世の写本などで見つかると思います。

言及された「賢い」ページのように、スペース文字の後に使用することは意図された使用法ではありませんが、無効でもありません。Unicode では、意味があるかどうかにかかわらず、任意の文字の後に結合記号を使用できます。

正規分解または互換分解がないため、文字を保持できない、または保持したくないコンテキストで処理する明確な方法はありません。

于 2013-03-06T18:25:44.170 に答える