28

UTF-8 での「行末」のバイナリ表現は何ですか。

4

3 に答える 3

46

たくさんあります:

  • LF: 改行、U+000A (16 進数の UTF-8: 0A)
  • VT: 垂直タブ、U+000B (16 進数の UTF-8: 0B)
  • FF: Form Feed、U+000C (16 進数の UTF-8: 0C)
  • CR: キャリッジ リターン、U+000D (16 進数の UTF-8: 0D)
  • CR+LF: CR ( U+000D ) の後に LF ( U +000A ) (16 進数の UTF-8: 0D0A)
  • NEL: 次の行、U+0085 (16 進数の UTF-8: C285)
  • LS: 行区切り記号、U+2028 (16 進数の UTF-8: E280A8)
  • PS: 段落区切り記号、U+2029 (16 進数の UTF-8: E280A9)

...そしておそらくもっとたくさん。

最も一般的に使用されるものは、LF(*nix)、CR+LF(Windows および DOS)、およびCR(ほとんどが OSX より前の古い Mac システム) です。

于 2012-12-12T09:16:57.420 に答える
23

Unicode 文字「LINE FEED (LF)」から

UTF-8 (16 進数) では --> 0x0A (0a)
UTF-8 (バイナリ) --> 00001010

ここに画像の説明を入力

于 2012-12-12T09:18:57.540 に答える
9

UTF-8 は ASCII と互換性があるため、改行の ASCII コード 10 (0x0A) とキャリッジ リターンの 13 (0x0D) も UTF-8 で使用されます。

于 2012-12-12T09:16:10.837 に答える