GitHub - muktihari/xmltokenizer: XML 令牌生成器是一个低内存高性能的非命名空间解析器库,用于解析简单的 XML 1.0。

主要观点:介绍了 XML Tokenizer 这一低内存高性能的非命名空间 XML 1.0 解析库,是标准库 xml 的替代选项,主要用于追求速度且愿意牺牲某些特性(如处理命名空间)的场景,可覆盖典型 XML 文件但不一定能涵盖所有 XML 文件。
关键信息

  • 有 GitHub 工作流状态、Go 参考、CodeCov 和 Go Report Card 相关链接。
  • 动机是标准库 xml 解析大文件速度慢(解析 14MB 含 208km 骑行数据的 GPX 文件需约 600ms 且分配 2806823 次),需要更快的解析库。
  • 提供了USAGE.md文档说明用法。
  • 基准测试显示,在处理特定 GPX 文件时,xmltokenizer 比标准库 xml 快约 4 倍(分别为 141616068ns/op 和 605913816ns/op,分配次数分别为 85 和 2806823)。
    重要细节
  • 库的特点是低内存、高性能。
  • 具体针对 GPX 这种 XML 格式文件进行优化。
  • 基准测试的环境为 darwin 系统、amd64 架构、Intel(R) Core(TM) i5 - 5257U CPU @ 2.70GHz 。
阅读 10
0 条评论