量子位 - SegmentFault 思否

碳足迹“安卓”系统TIDAS发布蚂蚁数科提供自主可控技术支持

今天 14:57

阅读 1 分钟

6月5日，在2025上海国际碳博会上，碳足迹产业技术创新联盟（以下简称“联盟”）发布“天工LCA数据系统”（TIDAS），旨在为生命周期评价（LCA）和碳足迹数据库构建提供科学、完整、前瞻的解决方案。这是我国首次在LCA和碳足迹数据体系全球性挑战中提出“中国方案”。

Figure机器人分拣快递新视频曝光，网友：太像人类

量子位

今天 14:25

阅读 4 分钟

与OpenAI分道扬镳后，Figure 02开启日夜进厂打工模式。这不，创始人刚刚放出最新监工视频。它干快递分拣员的活儿，愈发得心应手了。只见它把快递逐个码放整齐，让条形码朝下，方便扫描仪识别。碰到纸片型快递，翻面操作也轻松拿捏：它还懂得把快递整理得更平整，瞅见红色充气快递，也不盲目按压，直接放行：翻箱子的动作...

终于！全球爆火AI视频神器PixVerse发布国内版——拍我AI

量子位

今天 13:05

阅读 1 分钟

2025年6月，全球用户量最大的AI视频生成平台PixVerse正式推出国内版产品——“拍我AI”，同步上线网页端及移动端应用，并开放最新V4.5模型供用户使用。PixVerse自海外上线以来，已累计吸引全球超6000万用户，月活跃用户（MAU）突破1600万，稳居AI视频生成领域第一梯队。此次国内版的推出，标志着国内用户将能更直接地体验AI...

Gemini新版蝉联竞技场榜一，但刚发布就被越狱了

量子位

今天 12:11

阅读 3 分钟

没等来o3 Pro和GPT-5，隔壁谷歌的Gemini先更新了。深夜，谷歌通过等多个账号同时官宣，Gemini 2.5 Pro再次推出新版本（0605）。新版本在代码、推理等任务上的表现更上一层楼，在超难数据集“人类最后的考试”中以21.6%的成绩超过了o3。在大模型竞技场上，新版Gemini也超越了自己，Elo评分比上个月的版本提升了24分。谷歌CE...

上海AI实验室造出首个「通才」机器人大脑：看懂世界+空间推理+精准操控全拿下

量子位

6 月 5 日

阅读 3 分钟

112

该模型通过同时集成视觉感知、空间推理和机器人控制能力，可实现多模态大模型（MLLM）对物理实体的直接操控，使机器人能像人类一样“看到-思考-行动”。

大模型结构化推理优势难复制到垂直领域！最新法律AI评估标准来了，抱抱脸评测集趋势第一

量子位

6 月 5 日

阅读 4 分钟

130

为此，来自苏黎世联邦理工学院、瑞士联邦最高法院、马克斯-普朗克研究所及苏黎世大学等多个机构的研究人员联合发起并发布了一项全新的、多语言法律推理基准数据集——LEXam。

大神Karpathy炮轰复杂UI应用没有未来，Adobe首当其冲，网友：不提供文本交互，就是在阻挡AI浪潮

量子位

6 月 5 日

阅读 4 分钟

克雷西发自凹非寺量子位 | 公众号 QbitAI在人与AI高度协同的时代，只有大量复杂UI界面的应用将会被淘汰。大神Karpathy给出了对于应用程序未来的预言，并特别点名Adobe、CAD将首当其冲。△ ngmi是not gonna make it的缩写这样说的原因，Karpathy解释，只有复杂的UI界面而不提供文本交互，就无法和大模型形成有效的人机...

北京二环实测蔚来世界模型：心率飙到128

量子位

6 月 5 日

阅读 3 分钟

122

小长假期间，蔚来悄悄上线了世界模型蔚来NWM(NIO World Model)，落地了「车位到车位」，引发了一些车主好评，也有一些车主吐槽。

曝苹果AirPods推出睡眠检测等5大新功能，iOS系统也有12年来首次界面设计大改

量子位

6 月 5 日

阅读 3 分钟

苹果AirPods被曝即将迎来五大新功能！而且大部分都和用AirPods直接控制iPhone有关。据9to5Mac爆料，在即将到来的WWDC25大会上，苹果很有可能为AirPods装配以下新功能：用AirPods控制iPhone相机；睡眠自动暂停；支持通过头部动作控制AirPods；新增“录音室品质”麦克风模式；在教室场景中，简化AirPods连接到同一iPad的方式...

大模型公司挖墙脚哪家强？报告：Anthropic人才吸引力是OpenAI的8倍，留存率达80%

量子位

6 月 5 日

阅读 4 分钟

117

大模型公司挖墙脚哪家强，Anthropic才是最大赢家？不仅顶尖AI人才的留存率达到80%，而且工程师从OpenAI跳槽到Anthropic的可能性是从Anthropic转投OpenAI的8倍。不止OpenAI，大型科技公司也是Anthropic主要的人才猎场。谷歌、Meta、微软、亚马逊和Stripe，不少资深研究员和工程师都被Anthropic挖走了。这一数据来自风险投...

钉钉更新7.7.0版本，多维表全面免费！

量子位

6 月 5 日

阅读 2 分钟

144

据AppStore显示，钉钉在近日更新的7.7.0版本宣布多维表全面免费，并新增超过20个AI字段模板。在免费的钉钉多维表中，用户可根据需求用AI生成图片、解析文件、识别链接内容。同时，钉钉闪记针对面试、客户拜访等高频场景进行了升级，企业的HR、销售人员可以在面试和客户拜访过程中随时随地打开钉钉闪记语音转文字，并形成...

清华AI数学家：独立完成理论难题，自动调用基本定理构建证明思路

量子位

6 月 5 日

阅读 3 分钟

147

AI数学家来了！清华团队出品——他们推出AI Mathematician（AIM）框架，推理模型也能求解前沿理论研究，并且证明完成度很高。比如一道吸收边界条件问题。这是分析中涉及方程的经典理论问题，通过构造人工边界得到较为精确的近似解。AIM部分求解过程如下：AIM给出了方程的能量估计，这是求解这个问题的关键的中间结论。它不...

让AI像人类一样认知真实世界！UCLA谷歌强强联手，长时记忆+3D空间理解超越基线16.5%

量子位

6 月 4 日

阅读 3 分钟

142

想象一下，你在一个陌生的房子里寻找合适的礼物盒包装泰迪熊，需要记住每个房间里的物品特征、位置关系，并根据反馈调整行动。这一系列过程依赖人类强大的空间-时间长时记忆。如何让AI在3D环境中像人类一样思考，一直是具身智能领域的难题。加州大学洛杉矶分校（UCLA）与谷歌研究院的研究团队带来了最新进展：3DLLM-MEM...

蔚来把拐点悬念留到了Q2：一季度财报净亏67亿，股价反而涨了

量子位

6 月 4 日

阅读 4 分钟

189

奇了怪了。蔚来刚发布的季度财报，关键财务指标仍然惊人：一季度净亏67亿，仅次于去年Q4的71亿；账上的现金储备从去年年底的419亿锐减几乎三分之一…但财报发布后，蔚来股价非但没有大跌，反而一度涨超6%。而蔚来对自己的预期甚至还在向好，给出了72000~75000辆的Q2交付指引。看样子，蔚来终于等到了拐点，但悬念需要到第...

图灵奖得主Bengio再创业：启动资金就筹集了3000万美元

量子位

6 月 4 日

阅读 3 分钟

168

刚刚，深度学习三巨头之一、图灵奖得主Yoshua Bengio官宣再次创业——成立非营利组织LawZero，要构建下一代AI系统，而且明确不做Agent。目前LawZero已通过多家慈善捐赠方筹集到了3000万美元启动资金。具体来说，LawZero要做“设计即安全（safe-by-design）”的AI系统，要“将安全性置于商业利益之上”。所要做的AI系统非Agent...

GPT-4o连验证码都解不了？？SOTA模型成功率仅40%

量子位

6 月 4 日

阅读 4 分钟

168

MetaAgentX团队推出首个专注于“多模态交互智能体×CAPTCHA（人机验证）问题”的开放式研究平台——Open CaptchaWorld。

奥特曼：假如给我一千倍算力，我会这样做

量子位

6 月 4 日

阅读 3 分钟

199

完美的人工智能是“一个拥有超人推理能力、1万亿个上下文标记并可以使用你能想到的所有工具的微型模型”。这是奥特曼在最新的访谈中对下一代模型的展望。他表示，理想中的AGI不需要包含知识——只需要思考、搜索、模拟和解决任何问题的能力。它应该成为一个能够自主发现新科学，或者成为人类强大工具，使全球科学发现速度提...

00后中国女孩0产品创业实现3亿估值：斯坦福数学博士的AI量化野心

量子位

6 月 4 日

阅读 3 分钟

188

斯坦福华人数学博士AI创业，0产品0用户，目标估值3亿美元。方向瞄准数学AI，要为量化和对冲基金公司提供可解决实际数学问题的模型能力。（嗯，打造了DeepSeek的幻方量化，也是用AI来做投资量化）△来自个人主页来自中国广州的洪乐潼（Carina Letong Hong）近期开启创业，立马一鸣惊人。据The Information消息，她正在筹集...

单卡搞定万帧视频理解！智源研究院开源轻量级超长视频理解模型Video-XL-2

量子位

6 月 4 日

阅读 4 分钟

175

单张显卡，就能处理万帧视频输入，并且编码2048帧视频仅需12秒！国产开源模型又上大分，这次是在长视频理解领域：智源研究院联合上海交通大学等机构，正式发布新一代超长视频理解模型Video-XL-2。长视频理解是多模态大模型关键能力之一。尽管OpenAI GPT-4o、Google Gemini等私有模型已在该领域取得显著进展，当前的开源...

奥特曼宫斗要成好莱坞大片了！《哈利波特》同款制片人，主角人选被曝“蜘蛛侠”

量子位

6 月 4 日

阅读 3 分钟

171

The Hollywood Reporter消息，米高梅计划联手意大利知名导演卢卡·瓜达尼诺（Luca Guadagnino），将OpenAI高层的争斗翻拍成电影。

618大促前，拥有专属数字人是种怎样的体验？真·提效神器

量子位

6 月 4 日

阅读 3 分钟

207

如今，越来越多的商家正借助数字人进行营销推广。数据显示，即创平台用户每日使用AIGC生成的素材已突破40万条。商家们通过平台的数字人成片能力，显著提升了内容生产效率，大幅降低了视频制作周期和成本。更有前瞻性的商家，已解锁“高阶玩法”——在即创平台定制专属私有数字人，让另一个“自己”高效工作的梦想照进现实！

全球仅6家！GMI Cloud跻身Reference Platform NCP行列

量子位

6 月 4 日

阅读 2 分钟

146

GMI Cloud，一家快速崛起的 AI Native Cloud 服务商，近日正式成为Reference Platform NVIDIA Cloud Partner 。此次斩获该专项认证，凸显了 GMI Cloud 深厚的技术实力和全栈 AI 基础设施的领先能力，再一次践行了帮助全球 AI 团队从算力部署到模型开发实现规模化的承诺。

音频大模型安全可信度的全面“体检”！清华南洋理工联手打造

量子位

6 月 3 日

阅读 5 分钟

152

于是他们创新性地提出了新框架AudioTrust，将评估范围扩展至六个核心维度（公平性、幻觉、安全性、隐私、鲁棒性和身份验证），并深入探究了音频模态特有的安全、可信问题。

余承东含沙射影，雷军不点名回应，端午车圈口水仗没停

量子位

6 月 3 日

阅读 3 分钟

208

天底下最难干的工作是什么？余承东的媒体助理可能算一个。车圈口水战，端午也不停。余承东深圳开炮，助理在台下挥手示意都拦不住。他毫不遮掩，锐评行业现状：我们要打击吹牛X，鼓励真牛X。鸿蒙智行的辅助驾驶是第一名。按照华为的标准，有些车子都不能出厂。跨行进来的只做一款车就卖爆了，虽然车做得也不是很好。X界要...

论文秒变海报！开源框架PosterAgent一键生成顶会级学术Poster

量子位

6 月 3 日

阅读 5 分钟

241

相比GPT-4o，PosterAgent生成指标更优，同时token使用量减少87%，还只需要0.0045美元，就可将22页的论文转化为可编辑的 “.pptx” 终稿海报。

斯坦福临床医疗AI横评，DeepSeek把谷歌OpenAI都秒了

量子位

6 月 3 日

阅读 4 分钟

169

斯坦福最新大模型医疗任务全面评测，DeepSeek R1以66%胜率拿下第一！歪国网友纷纷被惊艳住了，原因在于该评测重点聚焦临床医生的日常工作场景，而非仅局限于传统医疗执照考试题。要评测就要全方位。团队构建了含35个基准测试的综合评估框架，覆盖22个子类别医疗任务。整个评测的分类体系还经过了临床医生验证，由29名...

Manus新功能一手实测！10分钟8页PPT，网友：当前第一名没跑

量子位

6 月 3 日

阅读 4 分钟

222

效果超预期、当前PPT制作第一名……Manus全新推出的幻灯片功能，正在收获一大波打工人的好评。并且，由于刚刚新增了支持导出为Google Slides，其关注度还在进一步上升。有网友直接让Manus帮忙将一篇研究论文制作成PPT（计划提交给科学期刊），结果却超乎其预期！节选其中一张来看，内容重点、示意图、数据等全都清晰直观，...

AI陪伴Top 1应用上线视频生成！图片人物能说话唱歌，多轮对话场景依然稳定

量子位

6 月 3 日

阅读 2 分钟

206

克雷西发自凹非寺量子位 | 公众号 QbitAIAI陪伴应用的Top 1——Character.ai（c.ai），也开始做起视频生成了。在c.ai平台中，可以让AI扮演各种角色陪你对话，现在有了视频生成，这些角色可以动起来了。c.ai展示了用户的创作成果，还自嘲称之为“内部运作模式可视化”，其中人物的表情、动作都和动画完美匹配。（视频请移...

训练MoE足足提速70%！华为只用了3招

量子位

6 月 3 日

阅读 4 分钟

221

Scaling Law之下，MoE（混合专家）如今已经成为各大模型厂商扩展模型能力的制胜法宝。不过，在高效实现模型参数规模化的同时，MoE的训练难题也日益凸显：训练效率不足，甚至一半以上训练时间都浪费在“等待”上。现在，为了突破MoE的训练瓶颈，华为出手了：构建了一套名为Adaptive Pipe & EDPB的优化方案，开启“上帝视...

李飞飞空间智能独角兽开源底层技术！AI生成3D世界在所有设备流畅运行

量子位

6 月 3 日

阅读 2 分钟

274

李飞飞空间智能创业公司World Labs，开源一项核心技术！Forge渲染器，可在桌面端、低功耗移动设备、XR等所有设备上实时、流畅地渲染AI生成的3D世界。具体来说，Forge是一款Web端3D高斯泼溅渲染器，无缝集成three.js，实现完全动态和可编程的高斯泼溅。Forge底层为GPU优化设计，其地位相当于传统3D图形领域的基础组件“着...