主要观点:Meta 在周末意外发布新的 Llama 4 多模态 AI 模型,虽宣称有重大进步和顶级性能,但初获混合至负面评价,凸显 AI 营销与用户体验的矛盾。
关键信息:
- 发布时间为周六,模型有 Llama 4 Scout 和 Llama 4 Maverick,Scout 有 1000 万 token 上下文窗口。
- 获 AI 社区初评不一,独立研究员 Simon Willison 称氛围一般,常关注开源 AI 发布动态。
- Meta 虽称与 OpenAI 和 Google 竞争,却有许可限制,更准确说是“开放权重”模式,可从 Hugging Face 或 llama.com 下载两小模型。
- 新模型为“原生多模态”,用“早期融合”技术处理文本和图像,与 OpenAI 和 Google 的多模态模型竞争。
- 用更大未发布的“教师”模型 Llama 4 Behemoth 训练,采用混合专家(MoE)架构,减少计算需求。
- 模型短期记忆有限,Scout 的大上下文窗口因内存限制使用困难,Meta 自己的示例笔记本显示运行大上下文需多高端 GPU,Willison 测试发现输出无用。
- Llama 4 Maverick 在某些技术基准上超竞争对手,但独立验证有限,Chatbot Arena 排行榜上版本有区别。
- 发布引发讨论,包括对多模态功能、MoE 架构、发布管理等的不满,与其他创新竞争者对比表现不佳,研究者认为这强化对传统单一大模型的怀疑,GPT-4.5 发布也类似,AI 领域存在训练大规模基础模型的 scaling 限制。Willison 对未来 Llama 4 版本乐观。
重要细节: - Llama 4 Maverick 有 4000 亿参数,一次只有 170 亿参数在 128 个专家中激活;Scout 有 1090 亿参数,一次 170 亿参数在 16 个专家中激活。
- 第三方服务提供的 Scout 上下文限制在 128000 或 328000 tokens,Meta 示例笔记本运行 140 万 token 上下文需 8 个高端 NVIDIA H100 GPU。
- Llama 4 现居 Chatbot Arena LLM 排行榜第二,但与下载的 Maverick 模型不同。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。