文本文件中“行尾”的 UTF-8 表示形式是什么

新手上路,请多包涵

UTF-8 中“行尾”的二进制表示是什么。

原文由 Husky 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 642
2 个回答

来自 Unicode 字符“LINE FEED (LF)”

在 UTF-8(十六进制)中它的 –> 0x0A (0a)

UTF-8(二进制)–> 00001010

在此处输入图像描述

原文由 anon 发布,翻译遵循 CC BY-SA 4.0 许可协议

一堆

  • LF :换行符, U+000A (十六进制的 UTF-8:0A)
  • VT :垂直制表符, U+000B (十六进制的 UTF-8:0B)
  • FF :换页, U+000C (十六进制的 UTF-8:0C)
  • CR :回车, U+000D (十六进制的UTF-8:0D)
  • CR+LF :CR( U+000D )后跟LF( U+000A )(十六进制的UTF-8:0D 0A)
  • NEL :下一行, U+0085 (十六进制的 UTF-8:C2 85)
  • LS :行分隔符, U+2028 (十六进制的 UTF-8:E2 80 A8)
  • PS :段落分隔符, U+2029 (十六进制的UTF-8:E2 80 A9)

…可能还有更多。

最常用的是 LF (*nix)、 CR+LF (Windows 和 DOS)和 CR -OS-X- 系统(旧的,主要是 OS-X- 之前的系统)。

原文由 T.J. Crowder 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题