3

具体的には、icon_strlen が不適切な文字シーケンスで失敗した場合の意味character sequencesを知りたいです。ありがとう

4

1 に答える 1

4

Acharacter sequenceは一連のバイトです。UTF-8 を使用する場合、すべてのバイトの組み合わせが有効であるとは限りません。

バイト シーケンスは、 UTF-8 エンコーディングを使用する場合の記号 (¼)で\xc2\xbcある Unicode 文字を形成しますU+00BCVULGAR FRACTION ONE QUARTER

バイト シーケンスは、 UTF-8 エンコーディングを使用する場合の記号 (∜)で\xe2\x88\x9cある Unicode 文字を形成しますU+221CFOURTH ROOT

UTF-8 エンコーディングの不適切な文字シーケンスは、 UTF-8バイト ストリームに必要なスキーマに適合しない任意のバイトの組み合わせです。たとえば、バイト シーケンスは\xbc\xbc不正です。ビットとして。110xxxxx\xbc10111100

于 2011-06-13T11:31:05.343 に答える