用于 AVX2、AVX-512 和 ASIMD 的更快的位置填充计数

主要观点:介绍了位置人口计数操作 pospopcnt(),其可计算 w 位字数组中每个 w 位被设置的次数,在生物信息学、数据库工程和数字处理等领域有多种应用。基于 Klarqvist 等人的早期工作,展示了如何使用 SIMD 技术快速计算位置人口计数,从第一个字节就有良好性能,对于仅 4 KiB 的输入数组能接近内存限制速度,还包括改进的算法结构、对未对齐和非常短数组的更好处理以及更快的中间结果位并行累加。
关键信息:23 页,11 幅图,相关源代码可在线获取(https://github.com/clausecker...https://github.com/lemire/pos...),学科为数据结构和算法(cs.DS),引用为[arXiv:2412.16370] [cs.DS](或[arXiv:2412.16370v1] [cs.DS]),通过 DataCite 提供 arXiv 发布的 DOI(https://doi.org/10.48550/ArXi...),提交历史由 Robert Clausecker 于 2024 年 12 月 20 日 22:01:22 UTC 提交(1,236 KB)。

阅读 18
0 条评论