Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
UTF-8 は、最初のバイトの先頭の 1 ビットの数が、シンボルで使用されるバイト数のカウントであるエンコードを使用します (1 バイト文字を除く)。
0xxxxxxx - 1 byte sequence 110xxxxx - 2 byte sequence 1110xxxx - 3 byte sequence 11110xxx - 4 byte sequence ...
単一バイトのケースを無視して、このエンコーディング技術の同様の/以前の使用法はありますか? 名前はありますか?
ウィキペディアによると、使用されている名前は「継続バイト」のようです。
可変長整数には、継続ビットを使用する代替アプローチが使用されます。
この特許出願では、これら 2 つを含む多くのアプローチについて説明しています (おそらく、より優れた代替案を提供する前に)。