刚刚,Qwen3正式发布并全部开源8款「混合推理模型」。

此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。

通义灵码已上线 Qwen3 模型,目前可在 VSCode、Visual Studio、JetBrains IDEs 等主流 IDE 的灵码插件体验。

// 多种思考模式

Qwen3 模型支持两种思考模式:

  1. 思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。
  2. 非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。

这种灵活性使用户能够根据具体任务控制模型进行“思考”的程度。例如,复杂的问题可以通过扩展推理步骤来解决,而简单的问题则可以直接快速作答,无需延迟。至关重要的是,这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。

// 多语言

Qwen3 模型支持 119 种语言和方言。这一广泛的多语言能力为国际应用开辟了新的可能性,让全球用户都能受益于这些模型的强大功能。

// 增强的 Agent 能力

Qwen3为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型 Agent 能力的 BFCL 评测中,Qwen3 创下70.8 的新高,超越 Gemini2.5-Pro、OpenAI-o1 等顶尖模型,这将大幅降低Agent调用工具的门槛。

同时,Qwen3 原生支持 MCP 协议,并具备强大的工具调用能力,结合封装了工具调用模板和工具调用解析器的 Qwen-Agent 框架。

这将大大降低开发者编码工作的复杂度,可以端到端地完成编码任务。通义灵码即将上线编程智能体,支持开发者配置自己的 MCP 工具,并集成魔搭 MCP 广场,开发者也可以一键下载 MCP 服务。

效果预览

欢迎大家在通义灵码插件端体验 Qwen3 加持的 AI 编码能力。下载链接:https://lingma.aliyun.com/download


阿里云云原生
1.1k 声望319 粉丝