苹果分享关于 iOS 26 即将推出的 AI 基础模型的细节

主要观点:苹果在最新 WWDC2025 上公布了将纳入 iOS26 的新苹果智能基础模型的相关细节,包括 3B 参数版本和更大的服务器端模型,强调训练方式及各模型特点与优势,还介绍了架构方面的技术及评估方式,最后强调了负责任人工智能的做法及相关教育资源。
关键信息

  • 有 3B 参数版本可在苹果硅设备运行,更大模型用于苹果私有云计算平台,均通过多种数据训练。
  • 3B 模型注重效率低延迟资源少,更大模型追求高精度可扩展性。
  • 3B 模型采用 KV-cache 共享和 2 位量化感知训练等技术,减少内存使用。
  • 服务器端模型使用并行轨道专家混合(PT-MoE)变压器。
  • 通过人类评估评估基础模型,各模型在不同对比中表现有优有劣。
  • 图像理解方面各模型也有相应表现。
  • 强调负责任人工智能及发布相关教育资源。
    重要细节
  • 3B 模型虽不能实现世界知识聊天,但可支持多种高级能力。
  • 量化感知训练中引入可学习缩放因子 f 模拟 2 位量化效果。
  • 服务器端模型结合多种技术提高效率。
  • 基础模型需 XCode26 和 iOS26,目前为测试版软件。
阅读 12
0 条评论