头图

2025年4月29日凌晨,阿里巴巴正式发布新一代大语言模型 Qwen3,以“混合推理”为核心,在性能、成本、灵活性三大维度实现跨越式突破。

赞奇也立刻着手使用8卡 H20 141GB 进行本地化部署,预计在五一节后发布Qwen3的并发测试报告,看看其实际应用体验究竟如何。

关注并私信即可优先获取测试报告!

Qwen3模型介绍:

Qwen3-235B-A22B 是一个大型模型,总参数量达2350 亿,激活参数量达 220 亿

Qwen3-30B-A3B 是一个较小的 MoE 模型,总参数量达 300 亿,激活参数量达 30 亿

Qwen3模型特点:

  • 混合思维模式

1.思考模式:在此模式下,模型需要逐步推理,最终给出答案。这对于需要深入思考的复杂问题非常理想。

2.非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于速度比深度更重要的简单问题。

这说明 Qwen3 既能在简单问题上快思考,秒出答案;又能在复杂问题上慢思考,展开多步推理和深入分析。

  • 多语言支持

Qwen3 模型支持119 种语言和方言。这种广泛的多语言能力为国际应用开辟了新的可能性,使全球用户都能受益于这些模型的强大功能。

  • 增强代理能力

本次 Qwen3 的更新,还体现在了 Agent 和代码能力,同时也加强了对 MCP 的支持。

值得一提的是,Qwen3 有一个配套的 Qwen-Agent 项目,可以方便地使用 API 进行工具调用,或结合现有的工具链进行扩展。

更多参考资料:

GitHub:

https://github.com/QwenLM/Qwen3

Hugging Face:

https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e...

ModelScope:

https://modelscope.cn/collections/Qwen3-9743180bdc6b48


老IT人
1 声望1 粉丝

IT从业20年,硬件避坑达人。