Joel の Unicode に関する記事を読んだ後でも、自分の Unicode の知識についてまだ確信が持てません。具体的には、次の質問が残っています。
コードポイントが大きすぎて一部のエンコーディング (ASCII) に収まらない文字列があるとします。たとえば、次のようになります。
U+67CF U+1AAB U+ABCD U+7034
するとジョエルはこう言います。
表現しようとしているエンコーディングで、表現しようとしている Unicode コード ポイントに相当するものがない場合は、通常、小さな疑問符が表示されます。または、あなたが本当に上手なら、箱。
しかし、この文字列は (2 進/16 進レベルで) ASCII でエンコードされたもの、またはサイズが不十分な他のエンコードでどのように見えるでしょうか?