20

WhatsApp からエクスポートした会話の txt ファイルがあります。WhatsAppは会話で絵文字をサポートしており、驚いたことに、エクスポートされた会話にもこれらの絵文字が含まれています! つまり、テキスト エディター (Mac 10.8 では Text Wrangler) でテキスト ファイルを開くと、顔文字が表示されます。テキスト ファイルは UTF-8 でエンコードされており、ファイルに関連付けられているリソースはありません。

これらの絵文字がどのようにテキスト ファイルに含まれているのか、テキスト エディターによってどのように正確に解釈されているのか、誰か説明してもらえますか? これは文字エンコーディングに関係していますか? 追加のリソースはテキスト ファイルに含まれていますか?

4

1 に答える 1

27

Unicode には、絵文字を「文字」として指定するセクションが含まれています。それらは通常の文字であり、それらを表示できるフォントのみが必要です。Unicode Emoji FAQも参照してください。

テキスト ファイルでは、文字は基本的にバイト形式の数値としてエンコードされます。これらをコンピューター画面に視覚的に表示するには、この文字をレンダリングするための視覚的なグリフを含むフォントが必要です。プロセスは常に数値識別子 → フォント → 目に見えるグリフであるため、「文字」が絵文字やその他の画像を含む視覚的なものである可能性があることは明らかです。

キャラクタービューア

于 2013-09-30T10:33:17.840 に答える