主要观点:呈现了为推动苹果智能功能而开发的基础语言模型,包括适用于设备的约 30 亿参数模型和用于私有云计算的大型服务器语言模型,描述了模型架构、训练数据、训练过程、推理优化及评估结果,强调了对负责任人工智能的关注及原则在模型开发中的应用。
关键信息:有众多作者参与,提交历史显示由 Ruoming Pang 于 2024 年 7 月 29 日 18:38:49 UTC 提交 v1 版本,相关 PDF 可查看[https://arxiv.org/pdf/2407.21075],HTML 实验版可查看[https://arxiv.org/html/2407.2...],引用为[arXiv:2407.21075](或[arXiv:2407.21075v1]),学科包括人工智能(cs.AI)、计算与语言(cs.CL)、机器学习(cs.LG),通过 DataCite 获得 arXiv 发布的 DOI 为[https://doi.org/10.48550/arXi...]。
重要细节:文中列出了众多作者的信息,涵盖多个领域和姓名,如 Tom Gunter 等,这些作者共同参与了模型的开发工作。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。