GPT-4o不敌Qwen,无一模型及格!UC伯克利港大等提出多模态新基准

5 月 14 日
阅读 3 分钟
895
多视图理解推理有新的评判标准了!什么是多视图理解?也就是从不同视角整合视觉信息进而实现理解决策。想象一下,机器人在复杂环境中执行任务,这就需要根据多个摄像头的画面准确判断物体位置、距离和运动方向,这就依赖于强大的多视图理解能力。但过去,由于评估多视图推理能力的基准测试稀缺,这一领域的研究进展相对...

数据中心不必建在地球!中国企业已经把算力设施送到了太空

5 月 14 日
阅读 3 分钟
893
AI算力,卷到天上了!12时12分,12颗太空计算卫星,搭乘长征二号丁运载火箭,在酒泉卫星发射中心顺利升空。这12颗计算卫星,每一颗都具备太空计算和太空互联的能力,将组成全球首个太空计算星座。它们的背后,是商业航天企业国星宇航牵头发起的“星算”计划。“星算”计划首发星座发射任务获得圆满成功,将开启全球“太空计算...

文生图进入R1时代:港中文发布T2I-R1,让AI绘画“先推理再下笔”

5 月 14 日
阅读 3 分钟
891
“先推理、再作答”,语言大模型的Thinking模式,现在已经被拓展到了图片领域。近日,港中文MMLab团队发布了第一个基于强化学习的推理增强文生图模型:T2I-R1。△文生图进入R1时刻:港中文MMLab发布T2I-R1大家都知道,OpenAI o1和DeepSeek-R1这类的大语言模型(LLMs),已经在解数学题和写代码这些需要“动脑筋”的事情上面展...

Flyme AIOS 2 操作系统正式发布,加速进入 AI 人人可及的新里程

5 月 14 日
阅读 4 分钟
929
2025 年 5 月 13 日,星纪魅族正式发布 Flyme AIOS 2 操作系统。星纪魅族一直致力于为用户打造一个流畅、优雅、智慧、互联的全能智慧生态系统,当进入以大模型为标志的 AI 智能时代,Flyme 实现了无数从 0 到 1 的重塑,数字 “2”,就意味着魅族将加速进入让 AI 人人可及的新里程。

国补价 594.15 元起!魅族 Note 16 系列 AI 手机发布

5 月 14 日
阅读 7 分钟
968
2025 年 5 月 13 日,星纪魅族正式发布魅族 Note 16 系列 AI 手机。作为魅族拥有 3000 万历史销量的经典 Note 系列,在新的时期,Note 16系列以国民严选的全新使命,为千元档的用户带来更流畅,更耐用的高品质手机。

Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型

5 月 14 日
阅读 4 分钟
933
克雷西 发自 凹非寺 量子位 | 公众号 QbitAIQwen3技术报告新鲜出炉,8款模型背后的关键技术被揭晓!采用了双模式架构,一个模型同时支持推理和非推理任务,根据需要自动切换。训练和微调过程采取分段式策略,逐步构建模型能力。采取了“大带小”的模式,从大号模型中蒸馏数据训练小号模型。有已经读完报告的网友,还发现了...

拿下38项第一!字节发布Seed1.5-VL多模态推理模型

5 月 14 日
阅读 4 分钟
875
字节发布轻量级多模态推理模型Seed1.5-VL,仅用532M视觉编码器+200亿活跃参数就能与一众规模更大的顶尖模型掰手腕,还是能带图深度思考的那种。

所有AI工具共享记忆!MCP协议杀疯了:100%本地运行,Cursor、Claude都能用

5 月 14 日
阅读 3 分钟
924
比如,你可以通过OpenMemory MCP用Claude规划路线图,但用Cursor执行任务,两个工具之间可以共享上下文信息,让数据得到延续。

蚂蚁数科企业级AI产品全线出海,首次在海外市场展现全栈产品矩阵

5 月 14 日
阅读 2 分钟
917
近日,在迪拜金融科技峰会2025期间,蚂蚁数科国际业务负责人陈逸石在演讲时透露,蚂蚁数科旗下企业级AI产品正在全线出海,服务海外市场客户数字化与智能化升级。据了解,这也是蚂蚁数科首次在海外市场展示其全栈AI产品矩阵。

裁员20000人!日本汽车巨头崩了

5 月 13 日
阅读 4 分钟
903
没想到,日产的危机已经大得这么惊人。日本广播协会(NHK)称,日产汽车正计划裁减1.1万人,加上之前的9000人,日产将在这一轮裁员风波里裁掉2万人,占员工总数的15%。但这还不够。日产宣布还将关闭三家工厂,最关键的是,其重金砸入、追赶比亚迪等车企的最大希望——九州电池工厂,现在也被迫叫停。原因也很现实,日产预...

天文预测新SOTA!紫东太初&国家天文台联手攻克恒星耀发难题

5 月 13 日
阅读 2 分钟
943
来自紫东太初和中国科学院国家天文台的研究团队,联合开发了天文耀发预测大模型FLARE (Forecasting Light-curve-based Astronomical Records via features Ensemble)。

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

5 月 13 日
阅读 3 分钟
881
一夜之间,近1.7万字系统提示词——包含24000个token,详细定义了模型行为、工具使用和引用格式…..全部细节直接在GitHub上被泄露了!

首个奖励模型评分基准!清华复旦港科大联合攻克AI评委“偏科”

5 月 13 日
阅读 6 分钟
938
模型胡乱论证“1+1=3”,评测系统却浑然不觉甚至疯狂打Call?是时候给奖励模型打个分了!来自清华大学、复旦大学和香港科技大学的研究团队,联合发布基准测试RM-BENCH,对大语言模型的”认知敏锐度”发出挑战。RM-BENCH首次系统性地构建了针对奖励模型的评测基准,直击其“形式大于内容”的评估困境。目前相关论文已被ICLR 202...

火山引擎发布豆包视频生成模型Seedance 1.0 lite

5 月 13 日
阅读 3 分钟
930
5月13日,在 FORCE LINK AI 创新巡展·上海站,火山引擎发布豆包·视频生成模型 Seedance 1.0 lite、豆包1.5·视觉深度思考模型,并升级豆包·音乐模型,以更全面的模型矩阵、更丰富的智能体工具,帮助企业打通从业务到智能体的应用链路。

AI大佬教你如何中顶会:写论文也要关注「叙事」

5 月 13 日
阅读 3 分钟
969
NeurIPS投稿数量破纪录了!Deadline还有不到一个月,如何让论文更容易中?大佬的论文撰写指南它来了。来自Google DeepMind的Neel Nanda在指导了20多篇论文之后,发布了一则关于如何写好机器学习论文的指南。旨在帮助研究者将研究成果转化为高质量、科学诚信的论文,解决在表达上“晦涩难懂”的痛点。让我们一起来看看一篇...

推理大模型1年内就会撞墙,性能无法再扩展几个数量级 | FrontierMath团队最新研究

5 月 13 日
阅读 3 分钟
909
一年之内,大模型推理训练可能就会撞墙。以上结论来自Epoch AI。这是一个专注于人工智能研究和基准测试的非营利组织,之前名动一时的FrontierMath基准测试(评估AI模型数学推理能力)就出自它家。与之伴随而来的还有另一个消息:如果推理模型保持「每3-5个月都以10倍速度增长」,那么推理训练所需的算力可能会大幅收敛。...

全球闲置算力训个模型,性能媲美R1,老黄天塌了!Karpathy曾投资它

5 月 13 日
阅读 7 分钟
867
一夜之间,老黄天塌了(doge)。全球首个分布式RL训练模型INTELLECT-2发布,它仅通过整合全球闲置或分散的计算资源,就完成了模型的强化学习训练,训练成本大大降低。其模型性能与DeepSeek-R1媲美!一旦范式成立,这也就意味RL训练摆脱了对集中式算力的依赖,世界上任何一个人都可以参与到模型训练当中,大公司垄断算力...

6个月估值翻倍!黄仁勋力荐的AI搜索公司欲开发浏览器取代Chrome

5 月 13 日
阅读 2 分钟
883
AI搜索引擎公司Perplexity新融资消息曝光!据金融时报消息,该公司正接近完成新一轮5亿美元融资谈判,最新估值达到近140亿美元(约合人民币1008亿元)。这些资金大概率将被用来开发新的AI浏览器,从而与Chrome展开竞争。从2022年至今,Perplexity估值可谓一路疯涨:2024年6月的估值为30亿美元;2024年12月飙升至90亿美元...

AI无限生成《我的世界》,玩家动动键盘鼠标自主控制!

5 月 13 日
阅读 5 分钟
884
用AI无限扩展《我的世界》,动动鼠标、键盘即可搞定!一直前进、砍掉树木,后面别有洞天的世界,都是由用户与环境交互、AI实时生成的。也就是说,在砍掉树木之前,树后面的内容还是不存在的。用鼠标切换视角、环顾环境,丝滑生成连贯画面内容。哪怕是跳跃,画面也非常稳定,且符合自然世界物理规律。Minecraft中森林、沙...

Manus终于开放注册!每天能免费玩一次

5 月 13 日
阅读 2 分钟
992
一夜带火整个智能体赛道的Manus,终终终于开放注册了。并且所有用户每天都能至少免费玩一次:开局就送1000积分,每天还能再+300。实测像这样做让Manus帮忙做一份租房攻略,消耗了267积分:Manus产品合伙人张涛表示,这是Manus团队两个月以来努力的成果:希望大家能够享受Manus的魅力。网友:还有点贵有一说一,真想拿Man...

清华&通院推出”绝对零”训练法,零外部数据大模型自我博弈解锁推理能力

5 月 12 日
阅读 4 分钟
852
不用引入外部数据,通过自我博弈(Self-play)就能让预训练大模型学会推理?来自清华、北京通用人工智能研究院和宾夕法尼亚州立大学的研究人员,提出了一种名为“绝对零”(Absolute Zero)的训练方式。这种方法通过让大模型根据推理目标,自己生成并解决任务,便可以获得推理能力。测试中,用“绝对零”训练出的模型,表现...

透视全球车企财报:为何中国车企活得更稳?

5 月 12 日
阅读 2 分钟
898
一般而言,制造业企业的资产负债率在40%-60%之间,而汽车产业的产业链更长,金融化水平更高,资产负债率也相对较高。很多车企的资产负债率都在60%以上,一些车企的资产负债率甚至超过了80%。

员工逼宫马斯克:你下台,特斯拉才有希望

5 月 12 日
阅读 3 分钟
929
人在特斯拉,逼宫CEO被解雇,账号被封杀。特斯拉业绩波动,又一次引发内部动荡,特斯拉多名员工倒反天罡,公开要求马斯克辞职。其中一名员工已经被开除,反对者的账号也被马斯克名下的社交平台火速封杀。解决不了问题就解决提出问题的人,似乎再一次应验了。几乎同一时间,特斯拉在美国负责生产Model Y的部分工人接到了...

开源全能图像模型媲美GPT-4o!解决扩散模型误差累计问题

5 月 12 日
阅读 3 分钟
843
开源的MLLMs和扩散模型已经过大规模预训练,其从零开始训练统一任务,不如取长补短,将MLLMs的语言建模能力,与扩散模型的像素级图像建模能力,进行有机的结合。

如何用上AI,用好AI?“2025腾讯云AI产业应用峰会”定档5月21日

5 月 12 日
阅读 1 分钟
879
随着AI大模型技术加速发展,产业应用实践也不断落地开花。腾讯云作为各行各业的数字化转型助手,积极推动低门槛、高可用的AI技术深入产业,助力产业智能化升级。

陶哲轩油管首秀:33分钟,AI速证「人类需要写满一页纸」的证明

5 月 12 日
阅读 4 分钟
833
快来围观,陶哲轩当视频博主了。第一个产出就很炸裂:人类需要写满一页纸的证明,结果借助AI 33分钟就搞定了?!整个过程看起来一气呵成,还是全程“盲证”不用过脑子那种。对于这一操作,网友们惊呆:这具有足够的历史意义。在没有明显引导、宣传之下,他的订阅数一天时间已经有900+,观看数超两千,目前仍然在高速增长中...

3个月闪电上市,宁德时代港股IPO募资360亿,石油巨头纷纷认购

5 月 12 日
阅读 4 分钟
899
刚刚,宁德时代在港交所发布公告,计划在5月12日-5月15日开启招股,拟发行1.18亿股H股,发行价格上限为263港元/股(折合人民币约244.8元/股)。

字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式

5 月 11 日
阅读 4 分钟
1.1k
字节Seed首次开源代码模型!Seed-Coder,8B规模,超越Qwen3,拿下多个SOTA。它证明“只需极少人工参与,LLM就能自行管理代码训练数据”。通过自身生成和筛选高质量训练数据,可大幅提升模型代码生成能力。这可以被视为对DeepSeek-R1模型自我生成和筛选训练数据策略的扩展。一共包含三个版本:BaseInstructReasoning其中,I...

比亚迪联手大疆,奶爸车17万开卖,车顶还带“停机坪”

5 月 11 日
阅读 3 分钟
185
一款车,集结两大硬核巨头,凑齐“海陆空”。比亚迪海狮07 DM,车长超4.8米的中大型SUV,价格区间16.98万-20.58万,全系标配天神之眼,全系支持选装大疆无人机。这是海洋网旗下首个搭载无人机的车型,作为一款面向家庭用户的产品,一台无人机把全家人都安排明白了:加16968元,给奶爸司机找个探路好搭子,给老婆上个旅拍出...

全球车市转折大年,西方落幕中国登场

5 月 10 日
阅读 3 分钟
120
全球汽车产业的天平,正在发生你我都能感知的“倾斜”。海外老牌主机厂缓步转身,新势力和中国车企加速换道超车,最容易被感知的是中国玩家的绝对增长:而不那么容易被感知的,深藏在各个玩家的业绩报告之中——短期看增长,中期看抗压,长期看的则是潜力和定力。全球车圈西边不亮东边亮随着全球车企年报季进入尾声,汽车产...