1

私はユニコードに関するこの記事を読んでいました - http://www.linuxjournal.com/content/unicode

概念をよりよく理解するために、VIM で Unicode 文字 'ഒ' U+0D12 を保存しました。(:%!xxd コマンドを使用して) 16 進モードに切り替えると、次のように表示されます。

0000000: e0b4 920a ....

\0a はエンディング \n です。しかし、他の16進値は私には意味がありません。誰でもこれに光を当てることができますか?

4

2 に答える 2

6
  • U+0D12ഒのUnicodeコードポイントです。
  • E0 B4 92ഒ を構成する 3 バイトを UTF-8 でエンコードした 16 進数表現です。
  • xxdは Unicode コード ポイントを認識していないか気にしていないため、デフォルトで想定されていることを実行します。つまり、指定したすべてのバイトの 16 進値が表示されます。

興味のある方はga、Vim で を押すと、カーソルの下にある文字の値がさまざまな形式で表示されます。

<ഒ&gt; 3346, Hex 0d12, Octal 6422

そしてg8、その 16 進値を示します。

e0 b4 92

非常に興味がある場合は:%!xxd -b、これらのバイトのバイナリ値を示します。

11100000 10110100 10010010
于 2013-09-20T12:21:04.933 に答える