T-摘要:分布的高效估计

主要观点:介绍了 t-digest 算法及其相关内容,包括其是用于从紧凑草图中准确估计分位数的在线算法,有开源 Java 实现及在其他语言中的独立实现,在各大公司内部广泛使用且在流行软件中也有应用,还介绍了其相关的亮点和摘要等信息。
关键信息

  • 可通过 PDF 查看相关内容,有 Elsevier 和 Software Impacts 的相关标识。
  • t-digest 能准确估计任意分布数据的分位数,可作为库或嵌入流行查询系统。
  • 其库有简单 API 且无运行时依赖,可在 GitHub 上获取。
  • 摘要中提及 t-digest 是构建小数据草图的算法,对偏态分布等有鲁棒性,草图可组合且无精度损失。
  • 提到 MSC 分类及关键词包括分位数估计、t-digest 等。
    重要细节
  • 给出了多个相关图片的链接。
  • 明确说明研究未获公共、商业或非营利性资助机构的特定资助。
阅读 15
0 条评论