主要观点:苹果在最新 WWDC2025 上公布了将纳入 iOS26 的新苹果智能基础模型的相关细节,包括 3B 参数版本和更大的服务器端模型,强调训练方式及各模型特点与优势,还介绍了架构方面的技术及评估方式,最后强调了负责任人工智能的做法及相关教育资源。
关键信息:
- 有 3B 参数版本可在苹果硅设备运行,更大模型用于苹果私有云计算平台,均通过多种数据训练。
- 3B 模型注重效率低延迟资源少,更大模型追求高精度可扩展性。
- 3B 模型采用 KV-cache 共享和 2 位量化感知训练等技术,减少内存使用。
- 服务器端模型使用并行轨道专家混合(PT-MoE)变压器。
- 通过人类评估评估基础模型,各模型在不同对比中表现有优有劣。
- 图像理解方面各模型也有相应表现。
- 强调负责任人工智能及发布相关教育资源。
重要细节: - 3B 模型虽不能实现世界知识聊天,但可支持多种高级能力。
- 量化感知训练中引入可学习缩放因子 f 模拟 2 位量化效果。
- 服务器端模型结合多种技术提高效率。
- 基础模型需 XCode26 和 iOS26,目前为测试版软件。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。