主要观点:介绍了 XML Tokenizer 这一低内存高性能的非命名空间 XML 1.0 解析库,是标准库 xml 的替代选项,主要用于追求速度且愿意牺牲某些特性(如处理命名空间)的场景,可覆盖典型 XML 文件但不一定能涵盖所有 XML 文件。
关键信息:
- 有 GitHub 工作流状态、Go 参考、CodeCov 和 Go Report Card 相关链接。
- 动机是标准库 xml 解析大文件速度慢(解析 14MB 含 208km 骑行数据的 GPX 文件需约 600ms 且分配 2806823 次),需要更快的解析库。
- 提供了USAGE.md文档说明用法。
- 基准测试显示,在处理特定 GPX 文件时,xmltokenizer 比标准库 xml 快约 4 倍(分别为 141616068ns/op 和 605913816ns/op,分配次数分别为 85 和 2806823)。
重要细节: - 库的特点是低内存、高性能。
- 具体针对 GPX 这种 XML 格式文件进行优化。
- 基准测试的环境为 darwin 系统、amd64 架构、Intel(R) Core(TM) i5 - 5257U CPU @ 2.70GHz 。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。