OpenELM:一个具有开放训练和推理框架的高效语言模型家族

主要观点:大型语言模型的可重复性和透明度对开放研究至关重要,为此发布 OpenELM 这一先进的开放语言模型,采用分层缩放策略提升准确性,且发布内容包括训练和评估语言模型的完整框架、多种训练日志、检查点及预训练配置,还发布将模型转换为 MLX 库用于苹果设备推理和微调的代码,以增强开放研究社区。
关键信息

阅读 135
0 条评论