头图
原文链接:ChatGPT发布最新版本!新版GPT-4 Turbo重回王座!碾压Claude

那个聪明、强大的 ChatGPT,终于又回来了!

ChatGPT也能用上最强的GPT-4 Turbo了!今天,新版GPT-4 Turbo再次重夺大模型排行榜王座,超越了Claude 3 Opus。

referer:https://twitter.com/OpenAI/status/1778574613813006610

同时OpenAI已经宣布,最新版本的能力会同时在开放。

referer:https://twitter.com/OpenAI/status/1778574617449545809

有了GPT-4 Turbo加持后,ChatGPT写作、数学、逻辑推理和编码的能力得到提升。

OpenAI 内部员工也发文表示,ChatGPT是目前最强大的。

就连奥特曼本人表示,「GPT-4现在更加智能,使用起来也更舒适」。

GPT大玩家在ChatGPT Plus版本上查看,发现训练数据已经更新到了2024年的4月份。

根据基准测试结果,GPT-4 Turbo在数学能力比上一代有了明显改进。

最重要的是!GPT-4 Turbo 可在 ChatGPT Plus、Team 、Enterprise 和 API 中使用。你还有什么理由不升级!

根据 ChatGPT升级 很方便就可以使用ChatGPT Plus和API了。

测评说明

前段时间,Anthropic手里的最强大模型Claude 3 Opus,可以说是霸榜各大榜单。

不过,就在今天,OpenAI凭借着全新的gpt-4-turbo,王者归来!

根据大模型专业评测机构lmsys.org 最新发布的gpt-4-turbo评测报告得出结论。

lmsys从多个领域收集了超过8000张人类投票,发现GPT-4-Turbo在编程与推理方面的表现,超越了其他模型。

referer:https://twitter.com/lmsysorg/status/1778555678174663100

研究人员还对编程领域中包含代码片段的所有对话进行了标记。在这一方面,GPT-4-Turbo展现出更强的性能。

类似的,Naman Jain也发现,新版GPT-4-Turbo在LiveCodeBench(包含编程竞赛题)上的表现,提高了惊人的4.5分,超越了其他所有的大模型。

作为程序员的 不要太开心。

其他综合测评

模型评分的置信区间 (CIs) :

整体的胜率热图:

总结

这一次OpenAI看来是真的被逼急了,拿出来自己的看家本领了,同时恭喜ChatGPT杀回第一名。

作为程序员的我,看到了这次ChatGPT在编程方面巨大的提升,真的是超级激动!

日常的工作和生活,我现在都是直接使用ChatGPT Plus来完成了,不仅功能更加丰富而且能力也更加强大。

当前人工智能飞速发展,作为见证这个发展的我们,我觉得我们每个人都可以体验和使用 ChatGPT Plus 工具,感受一下科技和人工智能给我们带来的震撼。


ChatGPT大玩家
1 声望0 粉丝

高级算法工程师 & 探索 AI & AIGC