主要观点:Mistral AI 发布 Devstral 开源大语言模型,与 All Hands AI 合作,旨在改进软件工程工作流自动化,属新型代理语言模型,能基于特定任务采取行动,处理真实编程问题,内部评估其在 SWE-Bench Verified 上性能超先前开源模型,比 Deepseek-V3-0324 和 Qwen3 232B-A22B 表现好,从 Mistral Small 3.1 基础模型微调而来,参数 240 亿,支持长上下文窗口,可在消费级 GPU 或苹果硅设备运行,以 Apache 2.0 许可证发布,可在多个平台下载和通过 API 使用,社区反馈有兴奋也有评估。
关键信息:
- 合作方:与 All Hands AI 合作。
- 目标:改进软件工程工作流自动化,处理真实编程问题。
- 性能:在 SWE-Bench Verified 上性能超先前模型,比 Deepseek-V3-0324 和 Qwen3 232B-A22B 好。
- 基础模型:从 Mistral Small 3.1 微调。
- 技术特点:支持长上下文窗口,参数 240 亿,可在消费级 GPU 或苹果硅设备运行。
- 许可证:Apache 2.0 许可证,可商业和非商业使用等。
重要细节: - 模型设计:可进行迭代修改、探索代码库、提出 bug 修复或新功能。
- 社区反馈:Product Builder 认为是进步,Reddit 用户称赞其性能。
- 后续计划:正在开发更大版本,邀请开发者反馈以完善模型和融入软件工具生态系统。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。