UTF-8 での「行末」のバイナリ表現は何ですか。
質問する
107950 次
3 に答える
46
たくさんあります:
LF
: 改行、U+000A (16 進数の UTF-8: 0A)VT
: 垂直タブ、U+000B (16 進数の UTF-8: 0B)FF
: Form Feed、U+000C (16 進数の UTF-8: 0C)CR
: キャリッジ リターン、U+000D (16 進数の UTF-8: 0D)CR+LF
: CR ( U+000D ) の後に LF ( U +000A ) (16 進数の UTF-8: 0D0A)NEL
: 次の行、U+0085 (16 進数の UTF-8: C285)LS
: 行区切り記号、U+2028 (16 進数の UTF-8: E280A8)PS
: 段落区切り記号、U+2029 (16 進数の UTF-8: E280A9)
...そしておそらくもっとたくさん。
最も一般的に使用されるものは、LF
(*nix)、CR+LF
(Windows および DOS)、およびCR
(ほとんどが OSX より前の古い Mac システム) です。
于 2012-12-12T09:16:57.420 に答える
23
UTF-8 (16 進数) では --> 0x0A (0a)
UTF-8 (バイナリ) --> 00001010
于 2012-12-12T09:18:57.540 に答える
9
UTF-8 は ASCII と互換性があるため、改行の ASCII コード 10 (0x0A) とキャリッジ リターンの 13 (0x0D) も UTF-8 で使用されます。
于 2012-12-12T09:16:10.837 に答える