尽管马斯克认可的“基于”观点,新发布的Grok 3仍登顶LLM排行榜

埃隆·马斯克的xAI公司发布Grok 3 AI模型

埃隆·马斯克的AI公司xAI于本周一发布了Grok 3,这是一款新的AI模型系列,旨在为社交网络X的聊天机器人功能提供支持。Grok 3在现有的文本和图像生成工具基础上,新增了图像分析和模拟推理功能。

训练与发布背景

Grok 3在xAI位于孟菲斯的数据中心进行了数月的训练,该数据中心据称拥有20万个GPU。马斯克在周一的直播演示中表示,Grok 3的计算能力是Grok 2的10倍。

功能与特点

Grok 3的发布引发了广泛关注,尤其是其可能作为马斯克世界观的AI工具。马斯克在社交媒体上分享了一段Grok 3对新闻媒体The Information的评价,称其为“垃圾”,并赞扬X平台提供未经过滤的新闻。然而,独立测试显示,这一输出并不典型,尽管Grok 3偶尔会表达观点。

早期评价与市场表现

尽管存在观点输出的争议,Grok 3的早期评价显示其表现优于竞争对手。目前,Grok 3在LMSYS Chatbot Arena排行榜上名列前茅。AI研究员安德烈·卡帕西(Andrej Karpathy)测试后表示,Grok 3在短时间内达到了OpenAI最强模型(如GPT-4o)的水平,甚至略优于DeepSeek-R1和Gemini 2.0 Flash Thinking。

订阅计划与未来计划

X Premium+订阅用户(每月50美元)将优先获得Grok 3的访问权限。据泄露消息,xAI计划推出SuperGrok订阅计划,价格为每月30美元或每年300美元,提供包括无限图像生成在内的额外功能。

多模型家族

Grok 3系列包含多个模型,包括一个较小的“mini”版本,该版本在准确性上有所妥协以换取速度。xAI声称,Grok 3在某些数学和科学基准测试(如AIME和GPQA)上优于OpenAI的GPT-4o。Grok 3 Reasoning和Grok 3 mini Reasoning模型还引入了模拟推理功能,用户可以通过“Think”命令或“Big Brain”模式访问这些功能。

未来功能与开源计划

xAI计划在一周内为Grok应用添加语音合成功能,并在未来几周内推出具备DeepSearch功能的企业API。此外,公司还计划在Grok 3稳定后开源Grok 2模型,预计这一过程将耗时数月。

本文于2025年2月19日上午6:53更新,以更好地描述埃隆·马斯克关于Grok 3的帖子。

阅读 8 (UV 8)
0 条评论