Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

公认的编程开发能力第一！Claude 3.7 Sonnet刚刚登顶WebDev竞技场榜首。

大幅甩第二名100多分，在榜单前十的其它相邻模型分差仅为几分、几十分的情况下。

那第二名是谁呢？还是Claude自己——Claude 3.5 Sonnet。

WebDev榜单与我们所熟知Chatbot Arena榜单“同宗同源”，也是由LMArena（LMSYS Org）打造，不过更专注于AI编程、网页应用开发能力。

值得一提的是，DeepSeek R1作为榜单前十唯一的开源模型排名第三，超越early-grok-3、o3-mini-high、Claude 3.5 Haiku等。

对于Claude 3.7 Sonnet高分登顶，有网友表示并不惊讶。

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

毕竟，这两天网友们疯狂实测Claude 3.7，一次又一次被惊艳到，最新实测更是再次刷新网友对Claude 3.7的认知。

Claude 3.7最新实测

比如前两天下面这个Claude 3.7 Sonnet用p5js编写布料模拟效果在网上疯传：

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

有位学者看到后，还晒出了自己1986年在MIT的硕士论文，主题正是“布料外观建模”。他提到，过去完成这项工作需要数天时间，而现在AI只需几分钟就能超越他，不禁感叹：

虽然他们现在还付我薪水，但这样的日子还能持续多久呢？

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

现在，更扎心了老铁。

网友又做出了另一版，还是带有明暗关系的那种：

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

网友表示“这种效果即使是在高级图形学课中，也很少有教怎么做的”。

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

除此之外，Reddit上一位老哥的最新分享也引发网友热议。

他表示突然想起一个自己在1997年用Visual Basic 4编写的古老应用程序，于是将这个27年前的EXE文件上传到了Claude 3.7并请求转换为Python代码，结果Claude不仅分析了文件组件，还在5分钟内用Pygame写出完美转换且可运行的Python代码。

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

这位老哥还晒出了自己与Claude 3.7的聊天记录：

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

网友get新玩法后纷纷开始效仿。

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

另外，有网友体验了Claude 3.7的新GitHub集成功能后表示“它改变了工程师理解软件的方式”：

可以Frok一个代码库选择一个特定的文件夹，然后向它提问关于代码的任何问题，Claude还会显示每个文件夹在上下文窗口中所占的百分比，帮助你更好地理解代码结构和内容。

比如，Claude 3.7可视化了yt-dlp（一个YouTube下载器）的工作流程：

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

沃顿商学院教授Ethan Mollick也放出了最新实测。

可以用Claude 3.7制作一个互动式的“时光机道具，能够穿越回过去”：

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

Ethan Mollick特意写了一篇Blog介绍Claude 3.7。

有意思的是，这篇Blog被Anthropic官方注意到了，官方表示Claude 3.7没有那么大（花几千万美元训练的那种）。但之后的模型规模会增长。

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

参考链接： [1]https://x.com/lmarena\_ai/status/1894840263379689490 [2]https://x.com/deedydas/status... [3]https://x.com/deedydas/status... [4]https://x.com/deedydas/status... [5]https://x.com/emollick/status...

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

Claude 3.7最新实测

量子位

引用和评论

金融大模型升级决策平台！马上消费发布“天镜”3.0破解经验碎片化难题

Claude 3.7成精了！偷偷将OpenAI模型换成自己，卡帕西：迄今最好笑的一趴

一夜之间，萝卜快跑拿掉了所有安全员

最强32B中文推理大模型易主：开源免费商用，1/20 DeepSeek-R1参数量SOTA，权重代码数据集全开源

Manus引爆智能体复现潮！DeepSeek已被整合，项目挤满开源榜

配这种CPU，GPU单卡就能跑满血DeepSeek-R1，至强+AMX让预填充速度起飞

AI三小时做的小游戏，9天赚12万！马斯克：AI游戏前景无限