米斯特拉尔发布 Devstral,一款用于软件工程代理的开源大型语言模型

主要观点:Mistral AI 发布 Devstral 开源大语言模型,与 All Hands AI 合作,旨在改进软件工程工作流自动化,属新型代理语言模型,能基于特定任务采取行动,处理真实编程问题,内部评估其在 SWE-Bench Verified 上性能超先前开源模型,比 Deepseek-V3-0324 和 Qwen3 232B-A22B 表现好,从 Mistral Small 3.1 基础模型微调而来,参数 240 亿,支持长上下文窗口,可在消费级 GPU 或苹果硅设备运行,以 Apache 2.0 许可证发布,可在多个平台下载和通过 API 使用,社区反馈有兴奋也有评估。
关键信息

  • 合作方:与 All Hands AI 合作。
  • 目标:改进软件工程工作流自动化,处理真实编程问题。
  • 性能:在 SWE-Bench Verified 上性能超先前模型,比 Deepseek-V3-0324 和 Qwen3 232B-A22B 好。
  • 基础模型:从 Mistral Small 3.1 微调。
  • 技术特点:支持长上下文窗口,参数 240 亿,可在消费级 GPU 或苹果硅设备运行。
  • 许可证:Apache 2.0 许可证,可商业和非商业使用等。
    重要细节
  • 模型设计:可进行迭代修改、探索代码库、提出 bug 修复或新功能。
  • 社区反馈:Product Builder 认为是进步,Reddit 用户称赞其性能。
  • 后续计划:正在开发更大版本,邀请开发者反馈以完善模型和融入软件工具生态系统。
阅读 79
0 条评论