2025年4月29日凌晨,阿里巴巴正式发布新一代大语言模型 Qwen3,以“混合推理”为核心,在性能、成本、灵活性三大维度实现跨越式突破。
赞奇也立刻着手使用8卡 H20 141GB 进行本地化部署,预计在五一节后发布Qwen3的并发测试报告,看看其实际应用体验究竟如何。
关注并私信即可优先获取测试报告!
Qwen3模型介绍:
Qwen3-235B-A22B 是一个大型模型,总参数量达2350 亿,激活参数量达 220 亿。
Qwen3-30B-A3B 是一个较小的 MoE 模型,总参数量达 300 亿,激活参数量达 30 亿。
Qwen3模型特点:
- 混合思维模式
1.思考模式:在此模式下,模型需要逐步推理,最终给出答案。这对于需要深入思考的复杂问题非常理想。
2.非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于速度比深度更重要的简单问题。
这说明 Qwen3 既能在简单问题上快思考,秒出答案;又能在复杂问题上慢思考,展开多步推理和深入分析。
- 多语言支持
Qwen3 模型支持119 种语言和方言。这种广泛的多语言能力为国际应用开辟了新的可能性,使全球用户都能受益于这些模型的强大功能。
- 增强代理能力
本次 Qwen3 的更新,还体现在了 Agent 和代码能力,同时也加强了对 MCP 的支持。
值得一提的是,Qwen3 有一个配套的 Qwen-Agent 项目,可以方便地使用 API 进行工具调用,或结合现有的工具链进行扩展。
更多参考资料:
GitHub:
https://github.com/QwenLM/Qwen3
Hugging Face:
https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e...
ModelScope:
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。