量子位 - SegmentFault 思否

出货195818台激光雷达重回第一！禾赛Q1交卷：机器人赛道出货猛增641%！

5 月 27 日

阅读 5 分钟

304

重回第一！激光雷达玩家禾赛科技，一季度夺回赛道No.1——激光雷达出货量195818台、装机量104687台，市占率31.6%。也代表了激光雷达赛道最前沿进展：经营上，营收同比增长近50%，在非GAAP准则下已经实现了盈利，年内完全实现盈利清晰可见，同样是目前行业唯一。技术上，刚刚发布了1440线激光雷达，行业最高实际线数，还有...

大厂程序员：AI正在将我们变成高速流水线工人，受不了了

5 月 27 日

阅读 3 分钟

320

万万没想到，大厂程序员真要成流水线工人了。这不是谁危言耸听，而是亚马逊不少程序员最近的亲身感受——很早开始，亚马逊官方就鼓励大伙儿在工作中用AI。结果发展到今天，“鼓励”更像是一种变相强迫：高层认为AI能提效，所以不少团队人员直接砍半，项目ddl却大大提前。搞得不少程序员已经不只是让AI打下手了，为了效率只能...

阿里开源长文本深度思考模型！渐进式强化学习破解长文本训练难题

5 月 27 日

阅读 4 分钟

352

其32B参数版本超过OpenAI-o3-mini、Qwen3-235B-A22B等，取得与Claude-3.7-Sonnet-Thingking相当的性能。

国内首个！夸克健康大模型通过副主任医师职称考试

5 月 27 日

阅读 1 分钟

338

此前，国内大模型多停留在临床执业医师资格考试阶段，只能拿到初级职称。夸克则实现了从初级到副高级职称的两级跳。夸克健康大模型以通义千问为基础，通过海量的高质量数据构建和多阶段后训练策略实现了此次突破。

百度心响上线iOS版，多智能体协作应用终于卷对地方了

5 月 27 日

阅读 5 分钟

257

今年的4月26日，我们测评了百度新发布的多智能体协作应用心响APP。当时只上线了安卓版，很多网友在线求苹果版链接。就在这几天，iOS版也终于上线了，只需要在苹果的APP Store搜索关键词即可下载。现在，苹果安卓用户全部免费用，完全不限量！在第一时间体验了iOS版心响APP，我们基本上可以下一个判断：智能体应用，终于...

Claude 4被诱导窃取个人隐私！GitHub官方MCP服务器安全漏洞曝光

5 月 27 日

阅读 3 分钟

302

被选为GitHub Copilot官方模型后，Claude 4直接被诱导出bug了！一家瑞士网络安全公司发现，GitHub官方MCP服务器正在面临新型攻击——通过在公共仓库的正常内容中隐藏恶意指令，可以诱导AI Agent自动将私有仓库的敏感数据泄露至公共仓库。就是说，当用户使用集成了GitHub MCP的Claude 4 ，用户的私人敏感数据可能遭到泄露。...

低Token高精度！字节复旦推出自适应推理框架CAR

5 月 27 日

阅读 4 分钟

377

过度依赖CoT思维链推理会降低模型性能，有新解了！来自字节、复旦大学的研究人员提出自适应推理框架CAR，能根据模型困惑度动态选择短回答或详细的长文本推理，最终实现了准确性与效率的最佳平衡。推理能力的进步极大提升了大语言模型（LLMs）和多模态大语言模型（MLLMs）在各类任务中的表现。但已有研究发现，长CoT推理...

形式化证明与大模型：共创可验证的AI数学未来｜量子位直播

5 月 27 日

阅读 1 分钟

274

就在5月，前有DeepSeek Prover V2发布，后有陶哲轩的AI数学直播，还有谷歌最新发布的AlphaEvolve。大模型“解数学题”的能力已经是衡量AI「智能天花板」的一种方式，正吸引着无数团队争相挑战。为了更好地评估AI完成数学推理的能力，近期发布的FormalMATH基准测试也备受关注。现在，AI完成自动定理证明的表现与挑战究竟如...

公认最美国产原创智能车，23万开卖

5 月 26 日

阅读 3 分钟

306

谁是最美轿跑？能列出一张长长的入围者名单。但如果问题是：谁是最美国产原创轿跑？蔚来ET5和ET5T，一定高票入围，不用争议，甚至没有“致敬”。而现在，在智能电动的内卷大战中，蔚来ET5&ET5T焕新推出了，主打一个加量不加价——更聪明、更舒适、更好开、续航上限更长。全车超45%部件升级，全系标配双电机，激光雷达和4...

11.59万元起！“国家队”杀入AI战场，2025款eπ007正式上市

5 月 26 日

阅读 3 分钟

264

这不是一次普通的新车发布。东风奕派用“VP虚拟制片+AI生成技术”改写了传统车企的舞台语言，把产品“秀”成了一场沉浸式AI科技秀，车圈直接炸场。

红杉中国推出全新AI基准测试xbench，要在AI下半场定义“好问题”

5 月 26 日

阅读 3 分钟

408

随着基础模型的快速发展和AI Agent进入规模化应用，被广泛用于评估AI能力的基准测试（Benchmark）却面临一个日益尖锐的问题：想要真实反映AI系统的客观能力正变得越来越困难，这其中最直接的表现——基础模型“刷爆”了市面上的基准测试题库，纷纷在各大测试榜单上斩获高分甚至满分。

机器人杭州上演格斗赛！拳拳到肉，宇树CEO王兴兴：创造了人类历史新时刻

5 月 26 日

阅读 5 分钟

310

激烈，着实激烈！全球首个人形机器人格斗赛刚刚在杭州落下帷幕，战况那叫一个精彩纷呈。贴身肉搏、侧身闪避、倒地后快速爬起…格斗技巧的十八般武艺通通拿出来了：当然也不乏搞笑画风，有选手直接对着空气一通乱挥：本次公开表演赛一共有四支参赛队伍，均使用了宇树科技G1人形机器人。在经过两两PK后，最终由名为“AI测算...

这届国产AI真的可以！20分钟生成万字报告，附带可视化网页，可直接下载食用

5 月 26 日

阅读 5 分钟

340

每天，真的是每一天，她一会儿回头问我这个数据算得对不对，一会儿微信上问我这个文章立意角度切入得妙不妙。终于，我不耐烦了，头也不抬地回了一句：

4000亿国产算力航母：芯片巨头合并超算巨头

5 月 26 日

阅读 3 分钟

397

中国算力巨震，海光信息、中科曙光两大巨头官宣拟合并！就在昨晚，上交所披露双方“关于筹划重大资产重组的停牌公告”：正在筹划由海光信息通过向公司全体A股换股股东发行A股股票的方式换股吸收合并中科曙光，并发行A股股票募集配套资金。根据公告，为保证公平信息披露，维护投资者利益，避免造成公司股价异常波动，两家公...

知乎聚集AI大咖深度对话，许华哲解析具身智能三大失败模式

5 月 26 日

阅读 2 分钟

339

清华大学交叉信息研究院助理教授、星海图联合创始人许华哲，42章经创始人曲凯，行云集成电路创始人季宇（mackler），阿里巴巴算法专家曹宇，硅基流动创始人袁进辉等数十位大模型领域从业者，齐聚一堂，深度探讨人工智能发展的关键变量和未来走向。

她如何把“系统2”带给了大模型｜对话微软亚洲研究院张丽

5 月 26 日

阅读 6 分钟

298

2023年，业界还在卷Scaling Law，不断突破参数规模和数据规模时，微软亚洲研究院张丽团队就选择了另一条路径。早在OpenAI o1发布前，张丽团队就开始探索大模型深度推理能力。System2这个原属认知科学的词汇最早由她及团队引入大模型领域。最近，她们通过蒙特卡洛搜索算法让7B模型实现了o1级别的数学推理能力。rStar—Math...

开源·开放·开创，2025张江具身智能开发者大会暨国际人形机器人技能大赛即将启幕

5 月 26 日

阅读 3 分钟

383

本次盛会集“峰会+大赛+展览”于一体，汇聚全球创新力量。峰会邀请200余家人形机器人产业链企业，1000余位院士、行业专家和开发者共同研讨前沿技术；通过举办1场主论坛、9场开发者论坛，为产业发展搭建全要素对接平台。大赛设置五大赛道，充分展示国际人形机器人技能水平。展览设置3000平方米展区，集中呈现行业创新成果。

鲲鹏昇腾开发者大会2025在北京成功举办

5 月 25 日

阅读 2 分钟

301

[中国，北京，2025年5月23日] 以“心怀挚爱，共绽光芒”为主题的鲲鹏昇腾开发者大会2025（KADC2025）在北京中关村国际创新中心成功举办。大会现场发布一系列新技术、新工具和新平台，使能伙伴和开发者高效开发，持续创新。面向通用计算领域，鲲鹏正式推出鲲鹏AI+解决方案，开源发布多样化算力集群软件开源社区openFuyao，...

人类打辩论不如GPT-4？！Nature子刊：900人实战演练，AI胜率64.4%，还更会说服人

5 月 25 日

阅读 3 分钟

391

只需知道6项个人信息，GPT-4就有可能在辩论中打败你？！而且胜率高达64.4%。这是几位来自瑞士洛桑联邦理工学院、普林斯顿大学等机构的研究人员得出的最新结论，相关研究目前登上了自然子刊《自然·人类行为》。具体而言，他们核心想弄清楚一件事——GPT-4在直接对话中是否比人类更具说服力，尤其在提前知道对方基本个人信息...

统计可控数据合成！新框架突破大模型数据生成局限，麦吉尔大学团队推出LLMSynthor

5 月 25 日

阅读 3 分钟

317

现有的数据合成方法在合理性和分布一致性方面存在不足，且缺乏自动适配不同数据的能力，扩展性较差。大语言模型受限于采样效率和上下文窗口大小，难以直接合成大规模数据集。如何用大模型生成结构对齐、统计可信、语义合理的数据，成为了亟待解决的问题。为此，麦吉尔大学团队提出了新方法LLMSynthor——通过这个方法，可...

半世纪计算机理论僵局被打破！MIT科学家偶然发现：少量内存节省大量计算时间

5 月 25 日

阅读 4 分钟

269

时间和内存（空间）是计算中最基本的两种资源，每个算法都需要一些时间来运行，并且在运行时需要一些空间来存储数据。迄今为止，已知的算法里所需的空间与其运行时间基本上都成正比，研究人员认为没有更好的办法。

Claude 4如何思考？资深研究员回应：RLVR已在编程/数学得到验证

5 月 24 日

阅读 4 分钟

387

这两天大家可以说是试玩了不少，有人仅用一个提示就搞定了个浏览器Agent，包括API和前端……直接一整个大震惊，与此同时关于Claude 4可能有意识并试图干坏事的事情同样被爆出。

AI项链？OpenAI首款硬件爆料，乔布斯爱将操刀，“像iPod Shuffle一样优雅”

5 月 24 日

阅读 4 分钟

384

OpenAI和强纳肾合作首发AI硬件，很可能是——项链？！才官宣合作没多久，就被知名苹果分析师郭明錤重磅爆料：新设备比Humane的AI Pin略大，外形却与iPod Shuffle一样紧凑优雅。奥特曼甚至已经抢先体验到了原型机，大致形态可能长这样：预期用法是可以戴在脖子上，显示屏NO，但内置摄像头和麦克风YES。嘶！听起来怎么有些熟...

微软AI公开折磨微软员工，修Bug唯一贡献是改了PR标题，GitHub评论区成吃瓜现场

5 月 24 日

阅读 5 分钟

482

微软著名开源项目.NET Runtime成了吃瓜现场，全球程序员在GitHub评论区围观嘲笑：微软用垃圾AI折磨微软员工，真是可悲又可笑。发生什么事？原来是新出的Copilot代码智能体在尝试帮忙自动修Bug，但那叫一个越帮越乱。Bug本身只是一个正则表达式的小问题，被分配给一位微软员工斯蒂芬和Copilot合作解决。Copilot在方案描述...

AI越聪明越不听话！新研究：最强推理模型指令遵循率仅50%

5 月 24 日

阅读 3 分钟

360

最近，上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models》，通过一个全新的评测基准MathIF揭示：

打破思维链推理瓶颈！“软推理”让大模型学会人类抽象能力，token使用量还更少了

5 月 24 日

阅读 3 分钟

417

来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking，让模型在连续的概念空间中进行 “软推理”，而非局限于离散的语言符号，打破了基于离散token的推理瓶颈。

大模型首次打破围棋思维「黑盒」，打通科学发现新路径！上海AI Lab发布新一代InternThinker

5 月 24 日

阅读 5 分钟

442

围棋因其独特的复杂性和对人类智能的深刻体现，可作为衡量AI专业能力最具代表性的任务之一。目前，AI虽然在棋力、效率、通用性等方面均取得显著成绩，但其具体推理过程仍处于“黑盒”之中，更无法用人类语言解释其思考过程和结果。大模型具备良好的自然语言交互性，如何通过提升大模型的推理能力，实现围棋专业能力突破，...

无需数据配对，文本嵌入也能互通？康奈尔研究：所有模型殊途同归

5 月 23 日

阅读 3 分钟

417

无需任何配对数据，就能实现文本嵌入的模型空间转换？！曾因llya离职OpenAI，在互联网上掀起讨论飓风的柏拉图表示假说提出：所有足够大规模的图像模型都具有相同的潜在表示。那么是否存在针对文本模型的通用潜在结构呢？康奈尔大学现在给出了Plus版答案——vec2vec，首个无监督文本嵌入的跨向量空间转换方法。利用共享潜在...

没有司机的萝卜快跑，正悄悄1天跑完1.5万单生意

5 月 23 日

阅读 4 分钟

552

文远知行的Robotaxi车队，已进入3大洲10城，数量超过1200辆，刚获得了Uber的1亿美元追加投资，达成目前行业内最大规模的Robotaxi合作计划。

WAVES 2025：新的开始，新的人

5 月 23 日

阅读 2 分钟

411

2024年的创投圈，像极了钱塘江的潮水——表面波澜不惊，水下暗流汹涌。AI赛道的沸腾，让我们看到中国创投正在悄悄蜕变，作为深耕创投领域多年的见证者，36氪第三届WAVES大会循例正式启动！6月11日-12日，杭州良渚，邀您共聚。

4

4