DeepSeek 官方:DeepSeek-R1 更新,思考更深,推理更强

北京

DeepSeek-R1 模型近日完成小版本升级,最新版本为 DeepSeek-R1-0528,显著提升了模型的思维深度与推理能力,并在多项测试中表现优异。新版模型在幻觉率、创意写作、工具调用等方面也进行了改进,同时支持更长的上下文长度和多种新功能。

关键点

  • DeepSeek-R1-0528 基于 DeepSeek V3 Base 模型,通过后训练增强了思维深度和推理能力,在数学、编程、通用逻辑等测试中表现出色。
  • 新版模型在 AIME 2025 测试中准确率从 70% 提升至 87.5%,并展现了更深层次的推理能力。
  • 幻觉率降低 45~50%,在改写润色、总结摘要、阅读理解等场景中更准确。
  • 创意写作能力提升,可输出更长、更贴近人类偏好的内容。
  • 支持工具调用,并在前端代码生成、角色扮演等领域有所更新。
  • API 更新支持 Function Calling 和 JsonOutput,默认 max_tokens 为 32K,最大支持 64K。
  • 开源版本支持上下文长度 128K,模型参数为 685B,用户可通过 MIT License 自由使用。
阅读 440
0 条评论