摘要
本文是阿里云CTO兼通义实验室负责人周靖人的访谈,重点介绍了阿里巴巴最新发布的通义千问Qwen3模型。Qwen3是全球首个开源的混合推理模型,能够根据问题选择不同的思考模式。文章详细探讨了阿里在大模型领域的布局、开源策略、技术发展规律以及与云计算的结合。
关键点
- 阿里巴巴发布了最新的通义千问Qwen3模型,是全球首个开源的混合推理模型。
- Qwen3模型在多个主要Benchmark上超越了DeepSeek-R1满血版。
- Qwen系列大模型已累计下载3亿次,衍生模型数量超10万个。
- 阿里开源模型分享平台魔搭社区上线,开源了达摩院研发的近400个模型。
- 开源大模型的选择需要接受市场反馈和各方测试。
- Qwen系列衍生模型数量超过了Meta Llama系列,成为全球第一。
- 阿里在技术社区的影响力较高,但在泛商业界相对低调。
- 阿里集团CEO吴泳铭表示阿里的首要目标是追求AGI。
- 开源技术至少会追上闭源,甚至发展得更快。
- 周靖人认为开源成功的例子很多,开源已成为大模型的重要创新驱动力。
- 阿里云和大模型有同样的优先级,必须齐头并进。
- 阿里近期宣布了3800亿的AI和云计算基础设施投入计划。
- 阿里在通义千问上的投入非常坚定。
- 通义千问系列比Meta Llama开源更晚,但反超了对方。
- 阿里开源了多个版本的Qwen3,包括稠密模型和MoE模型。
- 开源模型要真正让开发者能用起来,而不是仅仅开源代码或模型权重。
- 阿里云支持多种模型性能优化,留给客户选择权。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。