出货195818台激光雷达重回第一!禾赛Q1交卷:机器人赛道出货猛增641%!

5 月 27 日
阅读 5 分钟
304
重回第一!激光雷达玩家禾赛科技,一季度夺回赛道No.1——激光雷达出货量195818台、装机量104687台,市占率31.6%。也代表了激光雷达赛道最前沿进展:经营上,营收同比增长近50%,在非GAAP准则下已经实现了盈利,年内完全实现盈利清晰可见,同样是目前行业唯一。技术上,刚刚发布了1440线激光雷达,行业最高实际线数,还有...

大厂程序员:AI正在将我们变成高速流水线工人,受不了了

5 月 27 日
阅读 3 分钟
320
万万没想到,大厂程序员真要成流水线工人了。这不是谁危言耸听,而是亚马逊不少程序员最近的亲身感受——很早开始,亚马逊官方就鼓励大伙儿在工作中用AI。结果发展到今天,“鼓励”更像是一种变相强迫:高层认为AI能提效,所以不少团队人员直接砍半,项目ddl却大大提前。搞得不少程序员已经不只是让AI打下手了,为了效率只能...

阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题

5 月 27 日
阅读 4 分钟
352
其32B参数版本超过OpenAI-o3-mini、Qwen3-235B-A22B等,取得与Claude-3.7-Sonnet-Thingking相当的性能。

国内首个!夸克健康大模型通过副主任医师职称考试

5 月 27 日
阅读 1 分钟
338
此前,国内大模型多停留在临床执业医师资格考试阶段,只能拿到初级职称。夸克则实现了从初级到副高级职称的两级跳。夸克健康大模型以通义千问为基础,通过海量的高质量数据构建和多阶段后训练策略实现了此次突破。

百度心响上线iOS版,多智能体协作应用终于卷对地方了

5 月 27 日
阅读 5 分钟
257
今年的4月26日,我们测评了百度新发布的多智能体协作应用心响APP。当时只上线了安卓版,很多网友在线求苹果版链接。就在这几天,iOS版也终于上线了,只需要在苹果的APP Store搜索关键词即可下载。现在,苹果安卓用户全部免费用,完全不限量!在第一时间体验了iOS版心响APP,我们基本上可以下一个判断:智能体应用,终于...

Claude 4被诱导窃取个人隐私!GitHub官方MCP服务器安全漏洞曝光

5 月 27 日
阅读 3 分钟
302
被选为GitHub Copilot官方模型后,Claude 4直接被诱导出bug了!一家瑞士网络安全公司发现,GitHub官方MCP服务器正在面临新型攻击——通过在公共仓库的正常内容中隐藏恶意指令,可以诱导AI Agent自动将私有仓库的敏感数据泄露至公共仓库。就是说,当用户使用集成了GitHub MCP的Claude 4 ,用户的私人敏感数据可能遭到泄露。...

低Token高精度!字节复旦推出自适应推理框架CAR

5 月 27 日
阅读 4 分钟
377
过度依赖CoT思维链推理会降低模型性能,有新解了!来自字节、复旦大学的研究人员提出自适应推理框架CAR,能根据模型困惑度动态选择短回答或详细的长文本推理,最终实现了准确性与效率的最佳平衡。推理能力的进步极大提升了大语言模型(LLMs)和多模态大语言模型(MLLMs)在各类任务中的表现。但已有研究发现,长CoT推理...

形式化证明与大模型:共创可验证的AI数学未来|量子位直播

5 月 27 日
阅读 1 分钟
274
就在5月,前有DeepSeek Prover V2发布,后有陶哲轩的AI数学直播,还有谷歌最新发布的AlphaEvolve。大模型“解数学题”的能力已经是衡量AI「智能天花板」的一种方式,正吸引着无数团队争相挑战。为了更好地评估AI完成数学推理的能力,近期发布的FormalMATH基准测试也备受关注。现在,AI完成自动定理证明的表现与挑战究竟如...

公认最美国产原创智能车,23万开卖

5 月 26 日
阅读 3 分钟
306
谁是最美轿跑?能列出一张长长的入围者名单。但如果问题是:谁是最美国产原创轿跑?蔚来ET5和ET5T,一定高票入围,不用争议,甚至没有“致敬”。而现在,在智能电动的内卷大战中,蔚来ET5&ET5T焕新推出了,主打一个加量不加价——更聪明、更舒适、更好开、续航上限更长。全车超45%部件升级,全系标配双电机,激光雷达和4...

11.59万元起!“国家队”杀入AI战场,2025款eπ007正式上市

5 月 26 日
阅读 3 分钟
264
这不是一次普通的新车发布。东风奕派用“VP虚拟制片+AI生成技术”改写了传统车企的舞台语言,把产品“秀”成了一场沉浸式AI科技秀,车圈直接炸场。

红杉中国推出全新AI基准测试xbench,要在AI下半场定义“好问题”

5 月 26 日
阅读 3 分钟
408
随着基础模型的快速发展和AI Agent进入规模化应用,被广泛用于评估AI能力的基准测试(Benchmark)却面临一个日益尖锐的问题:想要真实反映AI系统的客观能力正变得越来越困难,这其中最直接的表现——基础模型“刷爆”了市面上的基准测试题库,纷纷在各大测试榜单上斩获高分甚至满分。

机器人杭州上演格斗赛!拳拳到肉,宇树CEO王兴兴:创造了人类历史新时刻

5 月 26 日
阅读 5 分钟
310
激烈,着实激烈!全球首个人形机器人格斗赛刚刚在杭州落下帷幕,战况那叫一个精彩纷呈。贴身肉搏、侧身闪避、倒地后快速爬起…格斗技巧的十八般武艺通通拿出来了:当然也不乏搞笑画风,有选手直接对着空气一通乱挥:本次公开表演赛一共有四支参赛队伍,均使用了宇树科技G1人形机器人。在经过两两PK后,最终由名为“AI测算...

这届国产AI真的可以!20分钟生成万字报告,附带可视化网页,可直接下载食用

5 月 26 日
阅读 5 分钟
340
每天,真的是每一天,她一会儿回头问我这个数据算得对不对,一会儿微信上问我这个文章立意角度切入得妙不妙。终于,我不耐烦了,头也不抬地回了一句:

4000亿国产算力航母:芯片巨头合并超算巨头

5 月 26 日
阅读 3 分钟
397
中国算力巨震,海光信息、中科曙光两大巨头官宣拟合并!就在昨晚,上交所披露双方“关于筹划重大资产重组的停牌公告”:正在筹划由海光信息通过向公司全体A股换股股东发行A股股票的方式换股吸收合并中科曙光,并发行A股股票募集配套资金。根据公告,为保证公平信息披露,维护投资者利益,避免造成公司股价异常波动,两家公...

知乎聚集AI大咖深度对话,许华哲解析具身智能三大失败模式

5 月 26 日
阅读 2 分钟
339
清华大学交叉信息研究院助理教授、星海图联合创始人许华哲,42章经创始人曲凯,行云集成电路创始人季宇(mackler),阿里巴巴算法专家曹宇,硅基流动创始人袁进辉等数十位大模型领域从业者,齐聚一堂,深度探讨人工智能发展的关键变量和未来走向。

她如何把“系统2”带给了大模型 |对话微软亚洲研究院张丽

5 月 26 日
阅读 6 分钟
298
2023年,业界还在卷Scaling Law,不断突破参数规模和数据规模时,微软亚洲研究院张丽团队就选择了另一条路径。早在OpenAI o1发布前,张丽团队就开始探索大模型深度推理能力。System2这个原属认知科学的词汇最早由她及团队引入大模型领域。最近,她们通过蒙特卡洛搜索算法让7B模型实现了o1级别的数学推理能力。rStar—Math...

开源·开放·开创,2025张江具身智能开发者大会暨国际人形机器人技能大赛即将启幕

5 月 26 日
阅读 3 分钟
383
本次盛会集“峰会+大赛+展览”于一体,汇聚全球创新力量。峰会邀请200余家人形机器人产业链企业,1000余位院士、行业专家和开发者共同研讨前沿技术;通过举办1场主论坛、9场开发者论坛,为产业发展搭建全要素对接平台。大赛设置五大赛道,充分展示国际人形机器人技能水平。展览设置3000平方米展区,集中呈现行业创新成果。

鲲鹏昇腾开发者大会2025在北京成功举办

5 月 25 日
阅读 2 分钟
301
[中国,北京,2025年5月23日] 以“心怀挚爱,共绽光芒”为主题的鲲鹏昇腾开发者大会2025(KADC2025)在北京中关村国际创新中心成功举办。大会现场发布一系列新技术、新工具和新平台,使能伙伴和开发者高效开发,持续创新。面向通用计算领域,鲲鹏正式推出鲲鹏AI+解决方案,开源发布多样化算力集群软件开源社区openFuyao,...

人类打辩论不如GPT-4?!Nature子刊:900人实战演练,AI胜率64.4%,还更会说服人

5 月 25 日
阅读 3 分钟
391
只需知道6项个人信息,GPT-4就有可能在辩论中打败你?!而且胜率高达64.4%。这是几位来自瑞士洛桑联邦理工学院、普林斯顿大学等机构的研究人员得出的最新结论,相关研究目前登上了自然子刊《自然·人类行为》。具体而言,他们核心想弄清楚一件事——GPT-4在直接对话中是否比人类更具说服力,尤其在提前知道对方基本个人信息...

统计可控数据合成!新框架突破大模型数据生成局限,麦吉尔大学团队推出LLMSynthor

5 月 25 日
阅读 3 分钟
317
现有的数据合成方法在合理性和分布一致性方面存在不足,且缺乏自动适配不同数据的能力,扩展性较差。大语言模型受限于采样效率和上下文窗口大小,难以直接合成大规模数据集。如何用大模型生成结构对齐、统计可信、语义合理的数据,成为了亟待解决的问题。为此,麦吉尔大学团队提出了新方法LLMSynthor——通过这个方法,可...

半世纪计算机理论僵局被打破!MIT科学家偶然发现:少量内存节省大量计算时间

5 月 25 日
阅读 4 分钟
269
时间和内存(空间)是计算中最基本的两种资源,每个算法都需要一些时间来运行,并且在运行时需要一些空间来存储数据。迄今为止,已知的算法里所需的空间与其运行时间基本上都成正比,研究人员认为没有更好的办法。

Claude 4如何思考?资深研究员回应:RLVR已在编程/数学得到验证

5 月 24 日
阅读 4 分钟
387
这两天大家可以说是试玩了不少,有人仅用一个提示就搞定了个浏览器Agent,包括API和前端……直接一整个大震惊,与此同时关于Claude 4可能有意识并试图干坏事的事情同样被爆出。

AI项链?OpenAI首款硬件爆料,乔布斯爱将操刀,“像iPod Shuffle一样优雅”

5 月 24 日
阅读 4 分钟
384
OpenAI和强纳肾合作首发AI硬件,很可能是——项链?!才官宣合作没多久,就被知名苹果分析师郭明錤重磅爆料:新设备比Humane的AI Pin略大,外形却与iPod Shuffle一样紧凑优雅。奥特曼甚至已经抢先体验到了原型机,大致形态可能长这样:预期用法是可以戴在脖子上,显示屏NO,但内置摄像头和麦克风YES。嘶!听起来怎么有些熟...

微软AI公开折磨微软员工,修Bug唯一贡献是改了PR标题,GitHub评论区成吃瓜现场

5 月 24 日
阅读 5 分钟
482
微软著名开源项目.NET Runtime成了吃瓜现场,全球程序员在GitHub评论区围观嘲笑:微软用垃圾AI折磨微软员工,真是可悲又可笑。发生什么事?原来是新出的Copilot代码智能体在尝试帮忙自动修Bug,但那叫一个越帮越乱。Bug本身只是一个正则表达式的小问题,被分配给一位微软员工斯蒂芬和Copilot合作解决。Copilot在方案描述...

AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%

5 月 24 日
阅读 3 分钟
360
最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models》,通过一个全新的评测基准MathIF揭示:

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了

5 月 24 日
阅读 3 分钟
417
来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking,让模型在连续的概念空间中进行 “软推理”,而非局限于离散的语言符号,打破了基于离散token的推理瓶颈。

大模型首次打破围棋思维「黑盒」,打通科学发现新路径!上海AI Lab发布新一代InternThinker

5 月 24 日
阅读 5 分钟
442
围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,但其具体推理过程仍处于“黑盒”之中,更无法用人类语言解释其思考过程和结果。大模型具备良好的自然语言交互性,如何通过提升大模型的推理能力,实现围棋专业能力突破,...

无需数据配对,文本嵌入也能互通?康奈尔研究:所有模型殊途同归

5 月 23 日
阅读 3 分钟
417
无需任何配对数据,就能实现文本嵌入的模型空间转换?!曾因llya离职OpenAI,在互联网上掀起讨论飓风的柏拉图表示假说提出:所有足够大规模的图像模型都具有相同的潜在表示。那么是否存在针对文本模型的通用潜在结构呢?康奈尔大学现在给出了Plus版答案——vec2vec,首个无监督文本嵌入的跨向量空间转换方法。利用共享潜在...

没有司机的萝卜快跑,正悄悄1天跑完1.5万单生意

5 月 23 日
阅读 4 分钟
552
文远知行的Robotaxi车队,已进入3大洲10城,数量超过1200辆,刚获得了Uber的1亿美元追加投资,达成目前行业内最大规模的Robotaxi合作计划。

WAVES 2025:新的开始,新的人

5 月 23 日
阅读 2 分钟
411
2024年的创投圈,像极了钱塘江的潮水——表面波澜不惊,水下暗流汹涌。AI赛道的沸腾,让我们看到中国创投正在悄悄蜕变,作为深耕创投领域多年的见证者,36氪第三届WAVES大会循例正式启动!6月11日-12日,杭州良渚,邀您共聚。