8

スペース1として扱われない UTF-8 に存在するゼロ幅文字は何ですか? 私は、主なブラウザーでレンダリングされないグリフに特に関心があります。見つからない四角形は決して表示されるべきではありません。

ユーザーが入力したデータをアルファベット順に並べる We​​b サービスは多数あります (Gmail のラベルなど)。これらの目に見えない文字を使用して、カスタム順序を適用したいと考えています。

1 スペースとして扱われますtrim: 一般的に使用されるおよび類似の実装では削除されません。gmailの例では、U+202F(狭い改行なしスペース)がトリミングされています。

編集:見えない文字は 1 つだけで十分です。結局のところ、それらは視覚的表現に影響を与えることなく繰り返される可能性があります (下位のコード ascii テキストが続くと仮定します):

[char]Z on first position
[char][char]B on second position
[char][char][char]C on third position

残念ながら、考えられるすべての文字は、すぐにトリミングされるか、並べ替え関数によって無視されます。

編集:幅がゼロ/見えないように見えるすべてのUTF-8文字を閲覧しましたが、必要に応じて機能するものはありませんでした。U+0 - U+20DEL、制御文字、 U+034F: などの記号でさえCOMBINING GRAPHEME JOINER (alias CGJ)、すべて適切に処理されるため、私の目的には使用できません。それでも探し続けます。

4

1 に答える 1

1

次のものを試すことができます。

U+200B ZERO WIDTH SPACE 
U+200C ZERO WIDTH NON-JOINER  
U+200D ZERO WIDTH JOINER
于 2012-09-24T17:57:52.533 に答える