量子位 - SegmentFault 思否

华为版《黑客帝国》首次亮相：训推复杂AI前先“彩排”，小时级预演万卡集群

今天 13:36

阅读 3 分钟

9

就在刚刚，华为首次亮相了一套“虚”的技术——数字化风洞，一个在正式训推复杂AI模型之前，可以在电脑中“彩排”的虚拟环境平台。这套有种《黑客帝国》意味般的技术（都是通过虚拟世界预演现实），是由华为马尔科夫建模仿真团队构建，可以小时级预演万卡集群方案。而之所以要在真枪实弹训推复杂AI模型之前来这么一个步骤，是...

趋境科技&英特尔生态沙龙举办，硬件、推理引擎、上层应用生态融合，打通大模型私有化“最后一公里”

今天 11:38

阅读 4 分钟

19

顶级投资人，行业领先的应用企业、技术企业及全球硬件巨头等行业嘉宾，深度碰撞大模型私有化部署的技术突破与产业实践。活动吸引百余位行业合作伙伴到场参与，共谋合作落地新机遇，交流氛围热烈。

o3-pro正式推出！说声“嗨”就花了80美元，思考1+1用时16分钟

今天 10:56

阅读 4 分钟

31

OpenAI深夜放大招，正式推出“最新最强版”推理模型o3-pro！而且同一时间，o3模型降价80%不降智。官方测评结果显示，在专家评估中，所有人一致更偏爱o3-pro而非o3的回答。此外，o3-pro也一举超越o3、o1-pro，成为当前最擅长数学、科学和编程的OpenAI模型。OpenAI CEO奥特曼也第一时间激动表示：这真是太聪明了！我第一次看...

新车智驾渗透率79%！比亚迪每卖5辆车就有4辆搭载高速NOA

今天 08:33

阅读 3 分钟

37

比亚迪的智能辅助驾驶，用户买单吗？超级认可，绝大比例买单。比亚迪刚刚给出了最新销量数据，其中“智驾”车型占比高达79%——门店每开出5辆新车，就有4辆至少搭载了高速NOA和自动泊车。这也是比亚迪连续第二个月，围绕智驾（智能辅助驾驶，下同）渗透率来公布销量，这不仅是对外宣示智能产品力的市场认可度，更是比亚迪在...

强化学习之父：LLM主导只是暂时，扩展计算才是正解

6 月 10 日

阅读 3 分钟

83

大模型目前的主导地位只是暂时的，在未来五年甚至十年内都不会是技术前沿。这是新晋图灵奖得主、强化学习之父Richard Sutton对未来的最新预测。就在刚刚的新加坡国立大学建校120周年（NUS120）之际，Sutton受邀发表演讲——塑造AI和强化学习的未来。其实，这已经不是Sutton第一次在公开场合表达类似的观点，早在他19年的著...

蚂蚁数科加速推进AI战略，设立“AI+产业创新”实验室

6 月 10 日

阅读 1 分钟

88

6月10日，在2025第九届数字金融与金融安全大会上，蚂蚁数科宣布天玑实验室全面升级，从原“数字身份安全实验室”升级为“人工智能+产业创新”实验室。实验室将聚焦AI大模型在产业应用中的关键技术突破，通过打造’产学研用’协同创新生态，推动AI技术创新与产业深度融合。

爱簿智能推出E300 AI计算模组：50TOPS国产算力，赋能边缘AI全场景高效部署

6 月 10 日

阅读 3 分钟

85

近日，爱簿智能正式推出面向边缘场景打造的E300 AI计算模组。这款产品搭载爱簿智能自研AI SoC芯片AB100，具备高达50TOPS的INT8算力和102GB/s LPDDR5内存带宽，支持FP16/FP32混合精度计算，专为边缘侧高性能AI任务设计，旨在为各行业提供高算力、低延迟、强可靠的国产化AI解决方案。依托全栈AI工具链与端云协同架构，E300...

60%情况下主流大模型没理解风险只是装懂！别被“安全答案”骗了

6 月 10 日

阅读 5 分钟

78

让推理模型针对风险指令生成了安全输出，表象下藏着认知危机：即使生成合规答案，超60%的案例中模型并未真正理解风险。换句话说，主流推理模型的安全性能存在系统性漏洞。针对此种现象，淘天集团算法技术-未来实验室团队引入「表面安全对齐」（Superficial Safety Alignment, SSA）这一术语来描述这种系统性漏洞。进一步...

不是视频模型“学习”慢，而是LLM走捷径｜18万引大牛Sergey Levine

6 月 10 日

阅读 3 分钟

84

为什么语言模型能从预测下一个词中学到很多，而视频模型却从预测下一帧中学到很少？这是UC伯克利大学计算机副教授Sergey Levine最新提出的灵魂一问。他同时是Google Brain的研究员，参与了Google知名机器人大模型PALM-E、RT1和RT2等项目。Sergey Levine在谷歌学术的被引用次数高达18万次。“柏拉图洞穴”是一个很古老的哲...

0.5B以小搏大拿下端侧模型新SOTA：4090可跑，长文本处理5倍常规加速丨清华&面壁开源

6 月 10 日

阅读 12 分钟

119

端侧性价比之王，清华大学和面壁智能团队开源新模型——MiniCPM 4，提供8B、0.5B两种参数规模，仅使用同级别开源模型22%的训练开销，就达到了同级别最优性能。MiniCPM4-8B是开源首个开源的原生稀疏模型，5%的极高稀疏度加持，让长文本、深思考在端侧真正跑起来。在MMLU、CEval、MATH500、HumanEval等基准测试中，以仅22%的...

北大伯克利联手“拷问”大模型：最强Agent也才40分！新基准专治“不听话”的AI分析师

6 月 10 日

阅读 3 分钟

98

给大模型当老师，让它一步步按你的想法做数据分析，有多难？结果是，连Claude-3.7和Gemini-2.5 Pro这样的顶尖选手，都开始“不听话”了。在一个全新的测试基准中，它们面对多轮、不断演进的指令，最终的任务成功率最高仅有40%。这项名为IDA-Bench的新基准，就是为了模拟真实世界中这种“边想边改”的分析场景而生。它不再是...

华为创造AI算力新纪录：万卡集群训练98%可用度，秒级恢复、分钟诊断

6 月 10 日

阅读 4 分钟

129

训练可用度达98%：这就好比你开着一辆车，全年365天里，有358天无论刮风下雨都能一脚油门就出发，从不掉链子，有问题可以随时检修，几乎不会耽误你的任何行程。

中科闻歌完成新一轮战略融资，引领企业级人工智能技术发展

6 月 10 日

阅读 2 分钟

108

近日，专注于决策智能的企业级AI服务商中科闻歌宣布完成新一轮战略融资，投资人为北京市石景山区现代创新产业发展基金有限公司（以下简称石景山区产业基金）。

20年物理疑云消散！「μ子异常」最新实验未发现显著偏差，标准粒子模型屹立不倒

6 月 10 日

阅读 3 分钟

111

一度轰动物理学界的「μ子异常」，凉了。美国费米实验室公布的最新实验结果显示：尽管在2021年，研究人员发现μ子的磁性超出理论预测0.1%，令粒子物理标准模型笼上一朵阴云。但他们的「最终」测试结果指出，并未发现新的显著偏差。也就是说，一切仍与标准模型相符，此前被认为可能颠覆粒子物理学的「异常」并不成立。所谓...

大模型能够自发形成“人类思维地图”！Nature子刊重磅研究揭示多模态大模型类脑机制

6 月 10 日

阅读 5 分钟

140

LLM能理解现实世界和各种抽象概念吗？还是仅仅在“鹦鹉学舌”，纯粹依靠统计概率预测下一个token? 长期以来，AI社区对这一问题存在很大的分歧。

李飞飞自曝详细创业经历：五年前因眼睛受伤，坚定要做世界模型

6 月 10 日

阅读 3 分钟

161

因为眼睛受伤暂时失去立体视觉，李飞飞更加坚定了做世界模型的决心。在a16z的最新播客节目中，“AI教母”李飞飞讲述了五年前因为一次角膜损伤暂时失去立体视觉的经历：尽管凭借多年经验能想象出三维世界，但一只眼睛看东西时，我开始害怕开车。但作为一名科学家，她也把这次经历当成一次宝贵的“实验”机会。这次生病让她明...

6分钟狂掉750亿市值！苹果发布会发啥了…

6 月 10 日

阅读 3 分钟

141

开场仅6分钟市值就突然缩水750亿美元（约合人民币5385.8亿元）！是什么让一众投资者对苹果发布会集体大失所望？咳咳，原来“罪魁祸首”又是它：Siri。早在今年WWDC大会召开之前，用户和投资者其实对Siri的更新寄予了厚望，然而开场没多久，苹果软件主管Craig Federighi就尴尬宣布相关更新可能要推迟到明年。几乎就在这一时...

激光雷达是门好生意吗？问界换华为，小鹏改视觉，头雁10%订单说没就没

6 月 10 日

阅读 5 分钟

124

杰西卡发自副驾寺智能车参考 | 公众号 AI4Auto激光雷达，是门好生意吗？今年这个问题正在变得越来越现实。头部格局上，激光雷达赛道依然是禾赛科技与速腾聚创双雄竞速，但过去潜藏的危险因素，现在开始变得尖锐。一方面是激光雷达的技术方案，正在被特斯拉、小鹏等拥护的纯视觉路线威胁。这也进而引发另一方面的危机...

给大模型装上「思维分段引擎」：浙大InftyThink解锁无限深度推理

6 月 9 日

阅读 3 分钟

158

学会“适当暂停与总结”，大模型终于实现无限推理。想象一下，让你一口气不歇地推演一个超复杂数学证明，大脑也会“内存溢出”吧？如今的大模型在长上下文推理中也面临同样的困境，随着推理长度增加而指数级增长的计算成本，以及由于长度受限而被迫中断推理过程。为了解决上述问题，浙江大学联合北京大学的研究团队从人类“分...

首创像素空间推理，7B模型领先GPT-4o，让VLM能像人类一样「眼脑并用」

6 月 9 日

阅读 3 分钟

159

当OpenAI的o3系列通过「图像思维」（Thinking with Images）让模型学会缩放、标记视觉区域时，我们看到了多模态交互的全新可能。

打破跨模态干扰，快手东北大学联合提出统一多模态框架，横扫多模态检索基准

6 月 9 日

阅读 4 分钟

200

多模态检索是信息理解与获取的关键技术，但其中的跨模态干扰问题一直是一大难题。可行的解决办法是构建一种统一的多模态表示方式，为此，来自快手与东北大学的研究人员推出了多模态统一嵌入框架——UNITE。UNITE的核心目标，就是构建一个能同时处理文本、图像、视频及其融合模态输入的统一嵌入器。它从数据策划与训练机制...

吉利炮轰“常压油箱”，比亚迪回应：浙江某车企也在用

6 月 9 日

阅读 2 分钟

188

车圈高管，周末团战了。这不，重庆车展论坛现场，吉利高管不藏了，直接明码开炮——重提油箱事件，点赞魏建军，保定车神获得了“吹哨人”新称号。现场，广汽埃安实名站队吉利，口头感谢直言，称其是“嘴替”。长安和奇瑞的发言没有含沙射影，但也提及了“价格战”问题。但是！这样现场针对性极强的活动，比亚迪的高管也参加了，...

太逼真！豆包·播客模型来了：一句话生成「苏超联赛」播客，很懂13太保的梗

6 月 9 日

阅读 4 分钟

192

家人们，又有好玩儿的AI出现了——火山引擎发布豆包·播客模型！来来来，我们直接听一段：音频地址：[链接]如何？是不是有亿点点被惊艳到了？两个AI的对话不论是语气、停顿、口语化，简直跟真人没有差别。男生AI在讲解故事的过程中，女生AI会时不时穿插“嗯”、“没错”、“对”这样的词儿来应和。我们甚至拿着这个demo问了一圈身...

AI七个月突破数学家“围剿”反超人类！14位数学家深挖原始推理token：不靠死记硬背靠直觉

6 月 9 日

阅读 3 分钟

201

从只能答对2%的题目，到在超难数学题集中刷下22%得分，甚至超过人类团队平均水平，大模型需要多长时间？现在，令数学家们都惊讶的结果已经尘埃落定：7个月。发生在大名鼎鼎的“专为为难大模型而生的”FrontierMath基准测试上的这一幕，在激起热议同时，也引发了新的思考：大模型们是怎么做到的？FrontierMath：包含300个数...

商汤小浣熊牵手蚂蚁百宝箱，共建AI+数据分析方案

6 月 9 日

阅读 2 分钟

141

商汤科技“小浣熊家族”与蚂蚁集团旗下智能体开发平台“蚂蚁百宝箱”正式达成生态合作，双方联合打造“AI数据分析助手”，为百宝箱广大用户提供大模型服务，后续还将直接登陆到支付宝平台。

奥特曼ChatGPT用法错了！最新研究：要求“直接回答”降低准确率，思维链提示作用也在下降

6 月 9 日

阅读 2 分钟

87

奥特曼使用大模型的方法，竟然是错的？来自沃顿商学院等机构的最新研究发现，备受奥特曼喜爱的“直接回答”提示，竟然会显著降低模型准确率。不过另一方面，这项研究也发现，在提示词中加入思维链（CoT）命令同样不好用——CoT提示对于推理模型非但没有效果提升，反而会增加时间和计算成本。而一些前沿的非推理模型，CoT提示...

双重突破：全球首个零售VLA大模型来了！开源OpenWBT让机器人遥操门槛暴降！

6 月 9 日

阅读 3 分钟

94

6月6日-7日，2025 北京智源大会召开。作为全球具身智能领域最具影响力的学术与产业双栖盛会，本次大会汇聚了顶尖科研机构、技术领军企业和开源社群。

阿里千问3下载量破千万！衍生模型数超13万稳居全球第一

6 月 9 日

阅读 1 分钟

211

在 Hugging Face、魔搭社区和 Ollama 等主流AI开源平台上，千问 3 的 0.6B、8B、30B 和 32B 四种尺寸模型下载量均突破百万。Hugging Face 数据还显示，千问系列衍生模型数量已超 13 万个，稳居全球第一。

8个数据集全面胜出！思维链推理刷新图学习表现上限

6 月 8 日

阅读 3 分钟

274

由于图数据拥有复杂的非线性结构和缺少文本信息，语言模型中的思维链（Chain-of-Thought，CoT）提示学习方法难以简单直接地应用于图数据。

腾讯顶尖学生招募启动！高中生可直接参与大模型/具身智能前沿研究

6 月 8 日

阅读 3 分钟

151

一年一度，腾讯又开始招募顶尖学生了——“星火挑战营”，计划招募60-70人，主要面向高二、高三学生（2025级高考生）。一旦入选，就有机会前往深圳总部，挑战一线产业难题。

1

1