通义千问 Qwen3 发布,对话阿里周靖人

北京

摘要

本文是阿里云CTO兼通义实验室负责人周靖人的访谈,重点介绍了阿里巴巴最新发布的通义千问Qwen3模型。Qwen3是全球首个开源的混合推理模型,能够根据问题选择不同的思考模式。文章详细探讨了阿里在大模型领域的布局、开源策略、技术发展规律以及与云计算的结合。

关键点

  • 阿里巴巴发布了最新的通义千问Qwen3模型,是全球首个开源的混合推理模型。
  • Qwen3模型在多个主要Benchmark上超越了DeepSeek-R1满血版。
  • Qwen系列大模型已累计下载3亿次,衍生模型数量超10万个。
  • 阿里开源模型分享平台魔搭社区上线,开源了达摩院研发的近400个模型。
  • 开源大模型的选择需要接受市场反馈和各方测试。
  • Qwen系列衍生模型数量超过了Meta Llama系列,成为全球第一。
  • 阿里在技术社区的影响力较高,但在泛商业界相对低调。
  • 阿里集团CEO吴泳铭表示阿里的首要目标是追求AGI。
  • 开源技术至少会追上闭源,甚至发展得更快。
  • 周靖人认为开源成功的例子很多,开源已成为大模型的重要创新驱动力。
  • 阿里云和大模型有同样的优先级,必须齐头并进。
  • 阿里近期宣布了3800亿的AI和云计算基础设施投入计划。
  • 阿里在通义千问上的投入非常坚定。
  • 通义千问系列比Meta Llama开源更晚,但反超了对方。
  • 阿里开源了多个版本的Qwen3,包括稠密模型和MoE模型。
  • 开源模型要真正让开发者能用起来,而不是仅仅开源代码或模型权重。
  • 阿里云支持多种模型性能优化,留给客户选择权。
阅读 44
0 条评论