苹果硅:来自朋友和协处理器的 4 点小帮助

主要观点:

  • 介绍了苹果硅芯片中 CPU 核心的工作方式、频率控制及两种核心类型,还提及了专业处理单元和协处理器等。
  • 分别详细阐述了 NEON 向量处理器、神经引擎(ANE)、苹果矩阵协处理器(AMX)、GPU 等专业处理单元的特点、工作原理及访问方式等。
  • 讨论了各处理单元在不同负载下的功耗情况,以及它们在苹果硅芯片高效设计中的作用。
  • 回顾了本系列之前的相关内容,并提供了进一步阅读的链接。

关键信息:

  • NEON 向量处理器可加速操作,提高浮点运算速度,内置在各 CPU 核心中,理论上可被开发者访问但实际较复杂。
  • 神经引擎是 M 系列芯片中的独立单元,仅可通过 CoreML 等访问,实际使用较少。
  • AMX 矩阵协处理器在各 CPU 核心集群中,性能优化于矩阵运算,访问严格受限。
  • GPU 可用于通用计算,不同 M 系列芯片的 GPU 性能不同,开发者可通过 Metal Shaders 访问。
  • 协处理器不用时功耗低,满载时功耗高,是苹果硅芯片高效设计的一部分。

重要细节:

  • M3 芯片中 E 核心的 NEON 单元处理速度约为 P 核心的 70%,且比 M1 中的 P 核心稍快。
  • 苹果对 AMX 未作公开承认和信息提供,相关研究由 Filho 等人进行。
  • M1 变体中 macOS 核心分配策略会考虑 AMX 使用,不同线程数时核心分配模式不同。
  • GPU 功耗随芯片变体而变化,M3 Pro 不同 GPU 功耗差异大。
  • 比较 CPU 核心和协处理器的能耗困难,但在某些情况下使用 CPU 核心不可行。
阅读 9
0 条评论