华为+DeepSeek,推理性能创新高!技术报告也公布出来了

5 月 19 日
阅读 5 分钟
401
部署超大规模MoE这件事,国产芯片的推理性能,已经再创新高了——不仅是“英伟达含量为0”这么简单,更是性能全面超越英伟达Hopper架构!而做到这一点的,正是华为昇腾;具体而言,共包含两个产品:CloudMatrix 384超节点部署DeepSeek V3/R1,在50ms时延约束下单卡Decode吞吐突破1920 Tokens/sAtlas 800I A2推理服务器部署De...

个人开发者训400亿参数大模型:分布式算力,DeepSeek架构,3090单卡部署

5 月 19 日
阅读 3 分钟
340
Psyche是一个基于Deepseek的V3 MLA架构的去中心化训练网络,测试网首次启动时直接对40B参数LLM进行预训练,可以在单个H/DGX上训练,并在3090 GPU上运行。

华为云黄瑾:昇腾云CloudMatrix 384 超节点定义下一代AI基础设施

5 月 18 日
阅读 3 分钟
389
5月16日,华为云AI峰会在北京召开,华为云副总裁黄瑾发表主题演讲,介绍了更多CloudMatrix 384 超节点技术优势与细节。他指出,随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁,超节点架构的诞生不仅是技术的突破,更是以工程化创新开辟AI产业的新路径。华为云CloudMatrix 384超...

最高300Pflops算力,超越”同行”67%!一文看懂华为云CloudMartix 384

5 月 18 日
阅读 3 分钟
446
它采用全对等互联架构,通过新型高速互联总线实现384 张卡互联成为一个超级云服务器,最高提供300Pflops的算力规模,比业界同类产品领先67%。

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

5 月 18 日
阅读 3 分钟
443
金磊 发自 凹非寺量子位 | 公众号 QbitAI天下苦大模型矩阵乘法久矣。毕竟不论是训练还是推理过程,矩阵乘法作为最主要的计算操作之一,往往都需要消耗大量的算力。那么就没有一种更“快、好、省”的方法来搞这事儿吗?有的,香港中文大学最新一篇仅10页的论文,便提出了一种新算法:能源可节省:5%-10%时间可节省:5%论文...

经典教材《泛函分析》作者逝世,享年99岁:首位获阿贝尔奖的应用数学家

5 月 18 日
阅读 4 分钟
386
史上首位获得阿贝尔奖(数学界诺奖)的应用数学家Peter Lax(彼得·拉克斯)逝世了,享年99岁。或许你对这个名字不太熟悉,但你很可能学过他编写的那个经典教材——《泛函分析》。纵观他的一生,拉克斯可以说是站在理论数学和应用数学交叉点的巨匠。同时,他也是最早将计算机技术应用于数学分析的先驱之一。拉克斯所提出的...

蔚来新车敢这样升级,我就要好好说道说道了!

5 月 18 日
阅读 4 分钟
384
新款ES6/EC6安全性怎么样,CEO率先亲测了。26.8万元起,新款蔚来ES6/EC6上市,买车送5年免费换电,25万级的价格,百万级的技术:ET9同款神玑芯片、同款激光雷达和4D成像雷达,同款座椅平台、同款毫米级直采式胎压传感器……同款CEO亲测高速爆胎,这些全都给到。这些组合的安全性表现,李斌率先替车主测试,从上车到120km/h...

打破56年数学铁律!谷歌AlphaEvolve自我进化实现算法效率狂飙

5 月 18 日
阅读 4 分钟
446
这是研究员对AlphaEvolve的最新评价,就在不久之前,谷歌DeepMind联合陶哲轩等一众顶尖科学家打造了「通用科学人工智能」AlphaEvolve,直接打破了矩阵乘法领域56年以来的效率基准。

OceanBase开发者大会:详解Data×AI战略,发布首个 RAG 产品

5 月 17 日
阅读 3 分钟
625
升级AI战略后的OceanBase迎来了首次开发者大会。5月17日在OceanBase第三届开发者大会上,OceanBase发布面向AI的应用产品PowerRAG,该产品提供开箱即用的RAG应用开发能力,是OceanBase面向AI时代的探索之一。作为AI战略一号位、CTO杨传辉表示,OceanBase正致力于构建Data×AI能力,面向AI时代推动一体化数据库向一体化数据...

通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API

5 月 17 日
阅读 3 分钟
513
强化学习(RL)+真实搜索引擎,可以有效提升大模型检索-推理能力。但问题来了:一方面,搜索引擎返回的文档质量难以预测,给训练过程带来了噪音和不稳定性。另一方面,RL训练需要频繁部署,会产生大量API开销,严重限制可扩展性。现在,来自阿里通义实验室的解决方案公开了:开源ZeroSearch,提供了一种无需与真实搜索引...

带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架

5 月 17 日
阅读 3 分钟
547
众所周知,我们人类在解决问题时,常常会借助视觉工具:解几何题时画辅助线,分析图表时用荧光笔标记。这些“动手”操作,极大地增强了我们的认知和推理能力。

OpenAI:GPT-5就是All in One,集成各种产品

5 月 17 日
阅读 3 分钟
554
GPT-5将会集大成于一体?!就在发布“最强编程智能体Codex”之后,OpenAI又接着在Reddit举行了“有问必答”活动。公司研究副总裁Jerry Tworek,剧透了下一代基础模型GPT-5的最新消息:为了减少模型切换,未来计划将Codex、Operator、Deep Research和Memory整合在一起。除此之外,其他Codex团队成员也纷纷开启了爆料模式,比...

做AI眼镜,为什么一定要有定制化大模型 | 对话雷鸟创始人李宏伟

5 月 16 日
阅读 8 分钟
579
自2023年10月Meta旗下的Ray-Ban Meta智能眼镜发布,标志着智能眼镜终端不再只是极客的玩具,而是可能成为继智能手机之后,人类与数字世界交互的下一个核心入口。

AI眼镜+键盘+配件=6999元?不不不这叫空间计算机

5 月 16 日
阅读 2 分钟
520
国产空间计算机已实现量产,618期间正式开售!AR眼镜创业公司INAIR,正式发布了全新的AI空间计算机,内置了自研的系统级AI助手。AI助手能深度学习你的使用习惯,主动预判需求,把被动回答变成了陪伴式交互。利用AI,INAIR空间计算机还能把任意照片变成3D,随手拍的风景也能让你仿佛身临其境。视觉上,INAIR空间计算机可...

一句话生成AI Agent,零成本体验,容智最新智能体来了

5 月 16 日
阅读 3 分钟
595
在当今人工智能应用蓬勃发展的浪潮中,AI Agent无疑备受瞩目,被视为人工智能走向成熟应用的关键载体,承载着众多企业智能化转型的期望。相关数据显示,未来两到三年内,中国人工智能市场规模有望突破500亿美元,年复合增长率预计达到30%,其中AI Agent将成为增长黑马,占据15%以上的份额。

百度AI搜索上线DeepSearch,支持主动思考支持和无限次免费使用

5 月 16 日
阅读 2 分钟
603
百度AI搜索日前重磅升级,推出国内首个基于百亿级内容库的深度搜索(DeepSearch),并上线了个人知识库、创作画布等创新功能,打造”边想边搜”的新一代智能搜索体验。

超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

5 月 16 日
阅读 6 分钟
570
MiniMax最新发布Speech-02,同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一!

ACL 2025录用结果公布,阿里国际AIB团队多篇论文入选

5 月 16 日
阅读 1 分钟
573
ACL即国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics),是自然语言处理(NLP)领域的顶级学术会议之一,ACL论文通常代表了该领域的前沿研究成果。

GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

5 月 16 日
阅读 7 分钟
625
多模态大模型(Multimodal Large Language Models, MLLM)正迅速崛起,从只能理解单一模态,到如今可以同时理解和生成图像、文本、音频甚至视频等多种模态。

PK百余家厂商!商汤大模型一体机获IDC推荐

5 月 16 日
阅读 2 分钟
590
近日,国际数据公司(IDC)发布了《中国AI大模型一体机市场分析与品牌推荐,2025》,报告显示,商汤大模型一体机从百余家厂商中脱颖而出,成功入选推荐报告。

鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了

5 月 16 日
阅读 3 分钟
551
刚刚,鹅厂把文生图卷出了新高度——发布混元图像2.0模型(Hunyuan Image 2.0),首次实现毫秒级响应,边说边画,实时生成!用户一边描述,它紧跟着绘制,整个过程那叫一个丝滑。不用等待,专治各种没有耐心。有些画面描述起来太费劲?别急,还有实时绘画板玩法。用户可以手绘想要的元素,然后辅以文字说明,在另一半画板...

卷爆了!智己L6全系标配城区NOA后轮转向800V,难怪狂揽3万单

5 月 16 日
阅读 3 分钟
558
年度最具产品力的智能纯电,新种子选手登场了。全新款智己L6,参数卷爆,产品力拉满,价格也拼了。限时20.49万元起售,冰箱、800V高压平台、城区NOA、数字底盘、后轮转向、能帮你点外卖的智能体加持座舱……这些全、部、标、配。100度,宁德时代,三元锂,传说中要十几万元成本的组合,现在不到24万元就拿下。甚至狠起来连...

ChatGPT的记忆机制被公开了

5 月 16 日
阅读 4 分钟
578
ChatGPT新版记忆功能居然被民间大佬逆向工程了!能引用历史记录,甚至还能悄悄藏个人资料?最近OpenAI推出了一项名为聊天历史记录的额外记忆功能,允许ChatGPT引用历史对话以进行个性化交互。相较于原有的保存记忆功能,新功能更私人、更懂你。相关功能默认关闭,需要用户自行在“设置->个性化->参考聊天记录”中启...

百万规模数据集打造人形机器人通用大模型,实现精细动作跨平台、跨形态动作迁移丨北大人大联合发布

5 月 16 日
阅读 3 分钟
587
又基于此数据集,研发了端到端的文本驱动动作生成模型,实现了具备规模效应的复杂、多样的人类动作生成,做到了人体动作向多类型人形机器人的动作迁移。

悠易科技战略升级:推出AI智能体矩阵,开启AI全域营销新征程

5 月 15 日
阅读 3 分钟
623
2025年5月15日,悠易科技在北京举办“智启全域·策动未来”AI全域营销媒体沟通会,正式宣布企业战略升级为“AI全域营销”,并推出悠易AI智能体矩阵,其中包含全新智能体产品。本次战略升级以 “AI引擎 + 智能体协同” 为技术底座,构建覆盖营销全链路的智能决策体系,标志着悠易科技在AI全域营销领域的技术布局与场景落地进入里...

ICML25 | 让耳朵「看见」方向!仅依靠360°全景视频,就能生成3D空间音频

5 月 15 日
阅读 2 分钟
619
在这样的背景下,一项在空间音频生成领域具有里程碑意义的研究应运而生——OmniAudio:它能够直接从360°视频生成空间音频,为虚拟现实和沉浸式娱乐带来了全新的可能性。

梁文锋署名DeepSeek新论文:公开V3大模型降本方法

5 月 15 日
阅读 4 分钟
667
具体而言,DeepSeek-V3之所以可以只用2048块H800,就能达到超大规模集群(如数万块GPU)相当的训练效果,核心在于四项创新技术:

95后天才创始人突然被董事会赶走!美国激光雷达头雁乱了

5 月 15 日
阅读 4 分钟
645
美国激光雷达一夜剧变!谁也没想到,代表着美国激光雷达产业“最后的希望”——Luminar,突然就宣布,公司的主心骨在内部调查后立即离职。这个主心骨不是别人,是创始人、CEO,奥斯汀·罗素(Austin Russell) 。这位刚过而立之年的硅谷天才,17岁辍学创办Luminar,24岁带领公司登陆纳斯达克,25岁跻身福布斯亿万富翁榜。但如今...

新晋顶流Agent颠覆设计师!Lovart一手实测来了:是该刷屏爆火

5 月 15 日
阅读 7 分钟
712
又一个Agent火爆全网——一句话搞定专业视觉设计,就连专业设计师大V都在疯狂安利!画风be like:咱就是说,一整个被fashion住了。创作出它们的设计从业者@Ege表示,自己用这个AI设计助手轻松搞定了一整套时装品牌视觉设计方案,而原本他自己一个人需要“花好几天时间”。还有人用这个Agent做了特斯拉Robotaxi的广告牌:结果...

新版Claude曝光:“极限推理”成最大亮点

5 月 15 日
阅读 2 分钟
575
O家(OpenAI)刚免费上线GPT-4.1,A家(Anthropic)这边也被曝出新消息——新版Claude Sonnet和Claude Opus,已经在路上了!这一消息来自The Information,根据它的说法,新版模型最大的亮点,就是“极限推理”(Extreme reasoning)。简单来说,这个新功能是通过在推理和工具使用之间建立动态循环,能够更智能地处理问题。...