ルール"NFD; [:Nonspacing Mark:] Remove; NFC"
をICUTransliteratorデモにフィードすると、文字Ø
(\u00d8
== LATIN CAPITAL LETTER O WITH STROKE
)はそのままになります(つまり、STROKEは削除されません)。
非マーキングスペースのリスト(Category )で、 ()または( )に類似したMn
名前の何かが見つかりません。 COMBINING DIAGONAL STROKE
COMBINING SHORT STROKE OVERLAY
\u0335
COMBINING LONG STROKE OVERLAY
\u0336
ただし、COMBINING SHORT SOLIDUS OVERLAY
(\u0337
)とCOMBINING LONG SOLIDUS OVERLAY
(\u0338
)は見つかります。o
それらは似ているように見えますが、とと組み合わせると、ブラウザで同じくらい太い線をレンダリングしますO
。
アクセスしたUnicodeデータは\u00d8
、その文字の分解を提供しません。
同時に、ICUコレーターデモは、プライマリ(レベル= 1 =ベースレター)コレーターを使用して、、、、、のそれぞれを同じコードポイントに照合しø
ますo
。Ø
O
o\u0337
O\u0338
これは、デモで使用されるCollatorのロケールが、Unicode仕様がサイレントである方法でベース文字を識別するように設定されていることを意味しますか?
LATIN [CAPITAL, SMALL] LETTER *
もしそうなら、音訳の文字からストロークを取り除きたい場合、カスタムのルールベースの音訳をする必要がありますか?