量子位 - SegmentFault 思否

GPT-4o不敌Qwen，无一模型及格！UC伯克利港大等提出多模态新基准

5 月 14 日

阅读 3 分钟

895

多视图理解推理有新的评判标准了！什么是多视图理解？也就是从不同视角整合视觉信息进而实现理解决策。想象一下，机器人在复杂环境中执行任务，这就需要根据多个摄像头的画面准确判断物体位置、距离和运动方向，这就依赖于强大的多视图理解能力。但过去，由于评估多视图推理能力的基准测试稀缺，这一领域的研究进展相对...

数据中心不必建在地球！中国企业已经把算力设施送到了太空

量子位

5 月 14 日

阅读 3 分钟

893

AI算力，卷到天上了！12时12分，12颗太空计算卫星，搭乘长征二号丁运载火箭，在酒泉卫星发射中心顺利升空。这12颗计算卫星，每一颗都具备太空计算和太空互联的能力，将组成全球首个太空计算星座。它们的背后，是商业航天企业国星宇航牵头发起的“星算”计划。“星算”计划首发星座发射任务获得圆满成功，将开启全球“太空计算...

文生图进入R1时代：港中文发布T2I-R1，让AI绘画“先推理再下笔”

量子位

5 月 14 日

阅读 3 分钟

891

“先推理、再作答”，语言大模型的Thinking模式，现在已经被拓展到了图片领域。近日，港中文MMLab团队发布了第一个基于强化学习的推理增强文生图模型：T2I-R1。△文生图进入R1时刻：港中文MMLab发布T2I-R1大家都知道，OpenAI o1和DeepSeek-R1这类的大语言模型（LLMs），已经在解数学题和写代码这些需要“动脑筋”的事情上面展...

Flyme AIOS 2 操作系统正式发布，加速进入 AI 人人可及的新里程

量子位

5 月 14 日

阅读 4 分钟

929

2025 年 5 月 13 日，星纪魅族正式发布 Flyme AIOS 2 操作系统。星纪魅族一直致力于为用户打造一个流畅、优雅、智慧、互联的全能智慧生态系统，当进入以大模型为标志的 AI 智能时代，Flyme 实现了无数从 0 到 1 的重塑，数字 “2”，就意味着魅族将加速进入让 AI 人人可及的新里程。

国补价 594.15 元起！魅族 Note 16 系列 AI 手机发布

量子位

5 月 14 日

阅读 7 分钟

968

2025 年 5 月 13 日，星纪魅族正式发布魅族 Note 16 系列 AI 手机。作为魅族拥有 3000 万历史销量的经典 Note 系列，在新的时期，Note 16系列以国民严选的全新使命，为千元档的用户带来更流畅，更耐用的高品质手机。

Qwen3家族训练秘籍公开：思考/非思考融进一个模型，大模型蒸馏带动小模型

量子位

5 月 14 日

阅读 4 分钟

933

克雷西发自凹非寺量子位 | 公众号 QbitAIQwen3技术报告新鲜出炉，8款模型背后的关键技术被揭晓！采用了双模式架构，一个模型同时支持推理和非推理任务，根据需要自动切换。训练和微调过程采取分段式策略，逐步构建模型能力。采取了“大带小”的模式，从大号模型中蒸馏数据训练小号模型。有已经读完报告的网友，还发现了...

拿下38项第一！字节发布Seed1.5-VL多模态推理模型

量子位

5 月 14 日

阅读 4 分钟

875

字节发布轻量级多模态推理模型Seed1.5-VL，仅用532M视觉编码器+200亿活跃参数就能与一众规模更大的顶尖模型掰手腕，还是能带图深度思考的那种。

所有AI工具共享记忆！MCP协议杀疯了：100%本地运行，Cursor、Claude都能用

量子位

5 月 14 日

阅读 3 分钟

924

比如，你可以通过OpenMemory MCP用Claude规划路线图，但用Cursor执行任务，两个工具之间可以共享上下文信息，让数据得到延续。

蚂蚁数科企业级AI产品全线出海，首次在海外市场展现全栈产品矩阵

量子位

5 月 14 日

阅读 2 分钟

917

近日，在迪拜金融科技峰会2025期间，蚂蚁数科国际业务负责人陈逸石在演讲时透露，蚂蚁数科旗下企业级AI产品正在全线出海，服务海外市场客户数字化与智能化升级。据了解，这也是蚂蚁数科首次在海外市场展示其全栈AI产品矩阵。

裁员20000人！日本汽车巨头崩了

量子位

5 月 13 日

阅读 4 分钟

903

没想到，日产的危机已经大得这么惊人。日本广播协会（NHK）称，日产汽车正计划裁减1.1万人，加上之前的9000人，日产将在这一轮裁员风波里裁掉2万人，占员工总数的15%。但这还不够。日产宣布还将关闭三家工厂，最关键的是，其重金砸入、追赶比亚迪等车企的最大希望——九州电池工厂，现在也被迫叫停。原因也很现实，日产预...

天文预测新SOTA！紫东太初&国家天文台联手攻克恒星耀发难题

量子位

5 月 13 日

阅读 2 分钟

943

来自紫东太初和中国科学院国家天文台的研究团队，联合开发了天文耀发预测大模型FLARE （Forecasting Light-curve-based Astronomical Records via features Ensemble）。

Claude1.7万系统提示词全网刷屏！Karpathy锐评：LLM缺乏关键范式

量子位

5 月 13 日

阅读 3 分钟

881

一夜之间，近1.7万字系统提示词——包含24000个token，详细定义了模型行为、工具使用和引用格式…..全部细节直接在GitHub上被泄露了！

首个奖励模型评分基准！清华复旦港科大联合攻克AI评委“偏科”

量子位

5 月 13 日

阅读 6 分钟

938

模型胡乱论证“1+1=3”，评测系统却浑然不觉甚至疯狂打Call？是时候给奖励模型打个分了！来自清华大学、复旦大学和香港科技大学的研究团队，联合发布基准测试RM-BENCH，对大语言模型的”认知敏锐度”发出挑战。RM-BENCH首次系统性地构建了针对奖励模型的评测基准，直击其“形式大于内容”的评估困境。目前相关论文已被ICLR 202...

火山引擎发布豆包视频生成模型Seedance 1.0 lite

量子位

5 月 13 日

阅读 3 分钟

930

5月13日，在 FORCE LINK AI 创新巡展·上海站，火山引擎发布豆包·视频生成模型 Seedance 1.0 lite、豆包1.5·视觉深度思考模型，并升级豆包·音乐模型，以更全面的模型矩阵、更丰富的智能体工具，帮助企业打通从业务到智能体的应用链路。

AI大佬教你如何中顶会：写论文也要关注「叙事」

量子位

5 月 13 日

阅读 3 分钟

969

NeurIPS投稿数量破纪录了！Deadline还有不到一个月，如何让论文更容易中？大佬的论文撰写指南它来了。来自Google DeepMind的Neel Nanda在指导了20多篇论文之后，发布了一则关于如何写好机器学习论文的指南。旨在帮助研究者将研究成果转化为高质量、科学诚信的论文，解决在表达上“晦涩难懂”的痛点。让我们一起来看看一篇...

推理大模型1年内就会撞墙，性能无法再扩展几个数量级 | FrontierMath团队最新研究

量子位

5 月 13 日

阅读 3 分钟

909

一年之内，大模型推理训练可能就会撞墙。以上结论来自Epoch AI。这是一个专注于人工智能研究和基准测试的非营利组织，之前名动一时的FrontierMath基准测试（评估AI模型数学推理能力）就出自它家。与之伴随而来的还有另一个消息：如果推理模型保持「每3-5个月都以10倍速度增长」，那么推理训练所需的算力可能会大幅收敛。...

全球闲置算力训个模型，性能媲美R1，老黄天塌了！Karpathy曾投资它

量子位

5 月 13 日

阅读 7 分钟

867

一夜之间，老黄天塌了（doge）。全球首个分布式RL训练模型INTELLECT-2发布，它仅通过整合全球闲置或分散的计算资源，就完成了模型的强化学习训练，训练成本大大降低。其模型性能与DeepSeek-R1媲美！一旦范式成立，这也就意味RL训练摆脱了对集中式算力的依赖，世界上任何一个人都可以参与到模型训练当中，大公司垄断算力...

6个月估值翻倍！黄仁勋力荐的AI搜索公司欲开发浏览器取代Chrome

量子位

5 月 13 日

阅读 2 分钟

883

AI搜索引擎公司Perplexity新融资消息曝光！据金融时报消息，该公司正接近完成新一轮5亿美元融资谈判，最新估值达到近140亿美元（约合人民币1008亿元）。这些资金大概率将被用来开发新的AI浏览器，从而与Chrome展开竞争。从2022年至今，Perplexity估值可谓一路疯涨：2024年6月的估值为30亿美元；2024年12月飙升至90亿美元...

AI无限生成《我的世界》，玩家动动键盘鼠标自主控制！

量子位

5 月 13 日

阅读 5 分钟

884

用AI无限扩展《我的世界》，动动鼠标、键盘即可搞定！一直前进、砍掉树木，后面别有洞天的世界，都是由用户与环境交互、AI实时生成的。也就是说，在砍掉树木之前，树后面的内容还是不存在的。用鼠标切换视角、环顾环境，丝滑生成连贯画面内容。哪怕是跳跃，画面也非常稳定，且符合自然世界物理规律。Minecraft中森林、沙...

Manus终于开放注册！每天能免费玩一次

量子位

5 月 13 日

阅读 2 分钟

992

一夜带火整个智能体赛道的Manus，终终终于开放注册了。并且所有用户每天都能至少免费玩一次：开局就送1000积分，每天还能再+300。实测像这样做让Manus帮忙做一份租房攻略，消耗了267积分：Manus产品合伙人张涛表示，这是Manus团队两个月以来努力的成果：希望大家能够享受Manus的魅力。网友：还有点贵有一说一，真想拿Man...

清华&通院推出”绝对零”训练法，零外部数据大模型自我博弈解锁推理能力

量子位

5 月 12 日

阅读 4 分钟

852

不用引入外部数据，通过自我博弈（Self-play）就能让预训练大模型学会推理？来自清华、北京通用人工智能研究院和宾夕法尼亚州立大学的研究人员，提出了一种名为“绝对零”（Absolute Zero）的训练方式。这种方法通过让大模型根据推理目标，自己生成并解决任务，便可以获得推理能力。测试中，用“绝对零”训练出的模型，表现...

透视全球车企财报：为何中国车企活得更稳？

量子位

5 月 12 日

阅读 2 分钟

898

一般而言，制造业企业的资产负债率在40%-60%之间，而汽车产业的产业链更长，金融化水平更高，资产负债率也相对较高。很多车企的资产负债率都在60%以上，一些车企的资产负债率甚至超过了80%。

员工逼宫马斯克：你下台，特斯拉才有希望

量子位

5 月 12 日

阅读 3 分钟

929

人在特斯拉，逼宫CEO被解雇，账号被封杀。特斯拉业绩波动，又一次引发内部动荡，特斯拉多名员工倒反天罡，公开要求马斯克辞职。其中一名员工已经被开除，反对者的账号也被马斯克名下的社交平台火速封杀。解决不了问题就解决提出问题的人，似乎再一次应验了。几乎同一时间，特斯拉在美国负责生产Model Y的部分工人接到了...

开源全能图像模型媲美GPT-4o！解决扩散模型误差累计问题

量子位

5 月 12 日

阅读 3 分钟

843

开源的MLLMs和扩散模型已经过大规模预训练，其从零开始训练统一任务，不如取长补短，将MLLMs的语言建模能力，与扩散模型的像素级图像建模能力，进行有机的结合。

如何用上AI，用好AI？“2025腾讯云AI产业应用峰会”定档5月21日

量子位

5 月 12 日

阅读 1 分钟

879

随着AI大模型技术加速发展，产业应用实践也不断落地开花。腾讯云作为各行各业的数字化转型助手，积极推动低门槛、高可用的AI技术深入产业,助力产业智能化升级。

陶哲轩油管首秀：33分钟，AI速证「人类需要写满一页纸」的证明

量子位

5 月 12 日

阅读 4 分钟

833

快来围观，陶哲轩当视频博主了。第一个产出就很炸裂：人类需要写满一页纸的证明，结果借助AI 33分钟就搞定了？！整个过程看起来一气呵成，还是全程“盲证”不用过脑子那种。对于这一操作，网友们惊呆：这具有足够的历史意义。在没有明显引导、宣传之下，他的订阅数一天时间已经有900+，观看数超两千，目前仍然在高速增长中...

3个月闪电上市，宁德时代港股IPO募资360亿，石油巨头纷纷认购

量子位

5 月 12 日

阅读 4 分钟

899

刚刚，宁德时代在港交所发布公告，计划在5月12日-5月15日开启招股，拟发行1.18亿股H股，发行价格上限为263港元/股（折合人民币约244.8元/股）。

字节Seed首次开源代码模型，拿下同规模多个SOTA，提出用小模型管理数据范式

量子位

5 月 11 日

阅读 4 分钟

1.1k

字节Seed首次开源代码模型！Seed-Coder，8B规模，超越Qwen3，拿下多个SOTA。它证明“只需极少人工参与，LLM就能自行管理代码训练数据”。通过自身生成和筛选高质量训练数据，可大幅提升模型代码生成能力。这可以被视为对DeepSeek-R1模型自我生成和筛选训练数据策略的扩展。一共包含三个版本：BaseInstructReasoning其中，I...

比亚迪联手大疆，奶爸车17万开卖，车顶还带“停机坪”

量子位

5 月 11 日

阅读 3 分钟

185

一款车，集结两大硬核巨头，凑齐“海陆空”。比亚迪海狮07 DM，车长超4.8米的中大型SUV，价格区间16.98万-20.58万，全系标配天神之眼，全系支持选装大疆无人机。这是海洋网旗下首个搭载无人机的车型，作为一款面向家庭用户的产品，一台无人机把全家人都安排明白了：加16968元，给奶爸司机找个探路好搭子，给老婆上个旅拍出...

全球车市转折大年，西方落幕中国登场

量子位

5 月 10 日

阅读 3 分钟

120

全球汽车产业的天平，正在发生你我都能感知的“倾斜”。海外老牌主机厂缓步转身，新势力和中国车企加速换道超车，最容易被感知的是中国玩家的绝对增长：而不那么容易被感知的，深藏在各个玩家的业绩报告之中——短期看增长，中期看抗压，长期看的则是潜力和定力。全球车圈西边不亮东边亮随着全球车企年报季进入尾声，汽车产...