近似第一主成分

主要观点:介绍了随机 2D 高斯分布的精确(红色)和近似(橙色)第一主成分,以及在计算机图形学中的应用,如颜色量化等。提出了一种简单的近似计算第一主成分的方法,即通过对每个点与均值点的差进行求和并归一化来得到近似方向,还将其翻译为 Python 代码并进行了测试,与sklearn.decomposition.PCA对比效果良好,同时在添加高斯噪声后也能保持较好性能,该方法已在实践中被证明可靠,且在 ShaderToy 上的定向包围盒计算示例中也有应用。
关键信息:

  • 第一主成分衡量点集的主要变化轴,是指向点集“最分散”方向的单位向量。
  • 颜色量化可视为将 RGB 立方体内的像素颜色空间分割为互斥子空间的任务。
  • 简单的近似方法是对每个点与均值点的差求和并归一化。
  • sklearn.decomposition.PCA对比效果良好,添加高斯噪声后也能保持较好性能。
    重要细节:
  • 代码中先对数据按最大方差轴排序,然后计算均值和方向,最后进行归一化。
  • 忽略了“直方图”概念,数据仍按最大方差坐标轴排序,以保证求和的确定性。
  • 作者在发布文章几天后,Tuan Kuranes 在 ShaderToy 上的定向包围盒计算示例中使用了该近似方法,但仅用于主方向,OBB 还需要其他两个方向。
  • 文中提到了相关的参考文献,如 Michael Orchard 和 Charles Bouman 的论文、Xiaolin Wu 的论文、exoquant-rs 和 exoquant.c 的 GitHub 链接以及 scikit-learn 上的 Incremental PCA 文档。
阅读 26
0 条评论