3

UTF-8 は、最初のバイトの先頭の 1 ビットの数が、シンボルで使用されるバイト数のカウントであるエンコードを使用します (1 バイト文字を除く)。

0xxxxxxx - 1 byte sequence
110xxxxx - 2 byte sequence
1110xxxx - 3 byte sequence
11110xxx - 4 byte sequence
...

単一バイトのケースを無視して、このエンコーディング技術の同様の/以前の使用法はありますか? 名前はありますか?

4

2 に答える 2

1

ウィキペディアによると、使用されている名前は「継続バイト」のようです。

于 2012-11-01T09:45:27.303 に答える
1

可変長整数には、継続ビットを使用する代替アプローチが使用されます。

この特許出願では、これら 2 つを含む多くのアプローチについて説明しています (おそらく、より優れた代替案を提供する前に)。

于 2012-11-01T09:48:41.200 に答える