具体的には、icon_strlen が不適切な文字シーケンスで失敗した場合の意味character sequencesを知りたいです。ありがとう
1 に答える
4
Acharacter sequenceは一連のバイトです。UTF-8 を使用する場合、すべてのバイトの組み合わせが有効であるとは限りません。
バイト シーケンスは、 UTF-8 エンコーディングを使用する場合の記号 (¼)で\xc2\xbcある Unicode 文字を形成しますU+00BC。VULGAR FRACTION ONE QUARTER
バイト シーケンスは、 UTF-8 エンコーディングを使用する場合の記号 (∜)で\xe2\x88\x9cある Unicode 文字を形成しますU+221C。FOURTH ROOT
UTF-8 エンコーディングの不適切な文字シーケンスは、 UTF-8バイト ストリームに必要なスキーマに適合しない任意のバイトの組み合わせです。たとえば、バイト シーケンスは\xbc\xbc不正です。ビットとして。110xxxxx\xbc10111100
于 2011-06-13T11:31:05.343 に答える