图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」

4 月 28 日
阅读 6 分钟
183
原创 关注前沿科技 量子位全球AI大模型智能涌现,现在正在进入“多模态时间”。一方面,全球业内各式各样的技术进展,都围绕多模态如火如荼展开。另一方面,AI应用和落地的需求中,多模态也是最重要的能力。没有多模态技术,何谈应用和落地?实际上,多模态的先锋共识和趋势,把代表性玩家的进展连点成线,也能看出来……看...

中关村科金喻友平: “平台+应用+服务”是企业大模型落地的最佳路径 | 中国AIGC产业峰会

4 月 28 日
阅读 3 分钟
148
关注前沿科技 量子位大模型技术加速向产业渗透,如何直击业务痛点、带来真实增效?“平台+应用+服务”是企业大模型落地的最佳路径。在第三届AIGC产业大会上,中关村科金总裁喻友平分享如上方法论。即使看似简单的需求,也需要经历需求拆解、数据调优与流程重构的闭环。在这个过程中,企服厂商需要提供好服务。中国AIGC产...

小小井字棋难倒大模型??大神卡帕西被OpenAI在线踢馆了

4 月 28 日
阅读 4 分钟
115
关注前沿科技 量子位宝可梦之后,让大模型玩井字棋又成了一个新的热门挑战。起因是网友在X上吐槽大模型宝可梦玩得不够好,结果被大神Karpathy翻了牌子:别盯着宝可梦了,让大模型玩井字棋会更有趣,它们不会。结果Karpathy的话引发了大量围观,有人表示惊讶,也有人在分析原因,还有人表示那句经典的话含金量还在上升:...

Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品

4 月 28 日
阅读 4 分钟
136
关注前沿科技 量子位多模态大模型几何解题哪家强?首个从几何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了!GeoSense,系统评测多模态大模型在几何原理识别和应用中的表现,评测基准的数据和评测代码均已开源。其背后团队来自淘天集团算法技术-未来生活实验室团队。人类在解答几何问题时,首先会...

量子位招聘 | DeepSeek帮我们改的招聘启事

4 月 28 日
阅读 3 分钟
112
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

数学家们仍在追赶天才拉马努金

4 月 27 日
阅读 7 分钟
239
关注前沿科技 量子位如果有这么一个人,写下这样的复杂公式,并声称是受女神梦中启发所得,大家伙儿通常会送他两个字:民科。但当这个人一生中数千次写下类似的数学公式和命题,并在此后的100年间,不断地被证实正确,那么就只有一个可能——他是拉马努金。之所以再度火爆,是因为直到今天,数学界还不断有最新发现,在验...

不到2年,AI PPT赛道第一!像素绽放CEO赵充:今年是AI应用创业最佳时期 | 中国AIGC产业峰会

4 月 27 日
阅读 4 分钟
139
关注前沿科技 量子位今年是AI应用创业最好的时期。在第三届AIGC产业峰会上,不到2年时间在AI PPT赛道做到NO.1的赵充如是说。原因有三:1)DeepSeek带动了整个AI应用市场的大盘,整体渗透率不止一倍大幅提升; 2)所有应用的范式都在发生切换,大量重新定义产品的机会涌现; 3)DeepSeek的出现让成本又降低了大约10倍。赵...

1亿图文对!格灵深瞳开源RealSyn数据集,CLIP多任务性能刷新SOTA

4 月 27 日
阅读 9 分钟
121
所有的图像和句子都基于冗余进行了严格过滤,在确保数据质量的同时,引入基于簇的语义平衡采样策略,构建了可满足多样工作需求的三种规模大小的数据集:15M、30M、100M。

7x24小时非人类科学家入场:当AI开始自主探索科学未知领域 | 多伦多大学

4 月 27 日
阅读 3 分钟
132
来自多伦多大学、IIT、清华大学、浙江大学、罗格斯大学、哈佛大学、佐治亚理工学院和伦敦大学学院的跨学科团队的最新研究指出,融合人工智能与机器人技术的“自主通才科学家(AGS)”不仅能独立完成从文献综述到实验验证的全流程,更可能以指数级速度推动科学发现,突破人类能力的物理与认知边界。

拜拜邀请码!首个现货超级智能体实测

4 月 26 日
阅读 6 分钟
256
原创 关注前沿科技 量子位和邀请码、内测说拜拜,百度95后年轻小团队以内部创业形式,30天肝出了个“手机端Manus”现货。主打「一站式」解决各种复杂问题,彻底改变AI手机助手“一问一答,用户需逐步引导AI给出期望答案”的模式。话不多说,来看栗子🌰。让它为上班久坐的宝子们制定一份减脂计划,只需输入极短的prompt,就能...

网易有道张艺:AI教育的规模化落地,以C端应用反推大模型发展 | 中国AIGC产业峰会

4 月 26 日
阅读 5 分钟
125
关注前沿科技 量子位大模型趋势下,教育领域正在经历前所未有的变革。从AI家教到AI原生学习硬件,大模型正在重塑当下的教育体验与范式。教育领域天然适用大模型,目前已经处在发展的第二、三阶段(个性化辅导和主动辅导学习),虚拟老师的第四阶段也将在不远后实现。网易有道智能应用事业部负责人张艺,在第三届AIGC产业...

GitHub版DeepResearch来了!覆盖所有代码库,模型架构可视化,背后贡献者也能扒 |免费

4 月 26 日
阅读 3 分钟
118
关注前沿科技 量子位专为GitHub打造的免费百科全书来了——DeepWiki,覆盖全球所有GitHub存储库,无需注册即可食用。最简单的触发模式,就是只需要把链接中「github」改为「deepwiki」字样,就可以生成项目专属的wiki百科页面。整个页面模块清晰流畅,还有生成可视化架构图(对比GitHub项目主页是没有的),每个部分都有相...

开源垂直领域高质量数据合成框架!专业QA自动生成,无需人工标注,来自上海AI Lab

4 月 25 日
阅读 3 分钟
129
关注前沿科技 量子位垂域模型训练,高质量问答数据稀缺一直是行业痛点。在垂直领域大模型训练中,人工标注成本高昂,合成数据又常陷入质量与专业性难以兼得的困境。为此,上海AI实验室等提出GraphGen。通过“知识图谱引导+双模型协同”机制,显著增强模型对垂域的理解能力。同时,研究团队已经在OpenXLab部署了Web应用,上...

量子位招聘 | DeepSeek帮我们改的招聘启事

4 月 25 日
阅读 3 分钟
142
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

宝马秀起汽车科技来,哪有其他汽车什么事…

4 月 25 日
阅读 5 分钟
318
原创 关注前沿科技 量子位这届上海车展,黑科技浓度爆表。有人,有机器人:不光有地上跑的,也有天上飞的:还有“不归牛顿管”的:BMW新世代驾趣概念车。科技正在改善出行,从内到外重塑出行工具,甚至改变了产品的展出方式。电动车时代的出行应该是怎样的,舒适取向的车型扎堆上市,电动车时代如何获得驾驶乐趣,上海车展...

亚马逊云计算Troy Cui:敦煌网飙升AppStore第二,企业如何应对激增流量是关键 | 中国AIGC产业峰会

4 月 25 日
阅读 5 分钟
175
原创 关注前沿科技 量子位敦煌网突然飙到苹果美区AppStore排名第二,面对如此泼天的流量,该用什么“姿势”来接住?在千变万化、快速发展的生成式AI时代下,如此“灰犀牛”事件,应当给每一个企业敲响一个警钟——如何确保企业的系统能够应对突发的用量激增?针对这一问题,亚马逊云科技大中华区数据及存储产品总监Troy Cui在...

从底层重构强化学习训练框架,阿里高德开源新方法:抛弃替代损失函数,仅需优化原始目标

4 月 25 日
阅读 4 分钟
175
关注前沿科技 量子位抛弃替代损失函数,仅需优化原始目标, 强化学习新范式来了:消除critic和reference模型,避免KL散度约束;解决优势函数和梯度估计两个偏差。来自阿里-高德地图的团队提出了一种相当简单的强化学习训练新方法:组策略梯度优化GPG (Group Policy Gradient)。GPG开创性地从底层重构强化学习训练框架,...

智能车速度刷新:仅10个月,首个纯端侧大模型上车量产!

4 月 24 日
阅读 4 分钟
337
原创 关注前沿科技 量子位端侧大模型圈子的《速度与激情》,就这么水灵灵地上演了。坐标上海车展,在长安马自达新车发布之际,车上的智能座舱竟然成了大亮点之一。因为速度着实有点太快——从零到量产,只花了10个月的时间!要知道,这件事儿在汽车领域里面,一般都是要按“年”这个单位来计算。此举可谓是一鸣惊人,一举刷...

天气预报精准到每条街!这家新型机构携手高校用AI驱动科研范式变革

4 月 24 日
阅读 8 分钟
139
关注前沿科技 量子位当城市天气预报有望精确到街镇,每条马路都可能拥有“独家预报”——这并非科幻场景,而是上海“扶摇”气象大模型带来的突破。近日,由上海科学智能研究院(下称上智院)与上海市气象局等联合研发的国内首个聚焦超大城市安全的AI气象预报模型正式亮相。其空间分辨率较传统模式提升3倍至1公里,推理速度从10...

质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025

4 月 24 日
阅读 2 分钟
155
达摩院在ICLR 2025上抛出的DyDiT架构:通过时间步长与空间区域的智能资源分配,将DiT模型的推理算力削减51%,生成速度提升1.73倍,而FID指标几乎无损!

UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

4 月 24 日
阅读 3 分钟
116
复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。

量子位招聘 | DeepSeek帮我们改的招聘启事

4 月 24 日
阅读 3 分钟
129
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

挤爆字节服务器的Agent到底啥水平?一手实测来了

4 月 23 日
阅读 6 分钟
330
原创 关注前沿科技 量子位“字节版Manus”有多能打?量子位实测在此。△扣子智能体生成的活动介绍网页我们用光了一天的对话额度,考验了扣子空间(Coze Space)的信息整理、任务执行、工具调用等多项技能。结果,仍处在早期测试中的扣子空间整体表现已经相当惊艳,在自主任务规划和资料搜集方面表现不错,已经具备解决很多...

轻松健康集团高玉石:AI产品和用户走得够近才能挖到新需求丨中国AIGC产业峰会

4 月 23 日
阅读 3 分钟
107
关注前沿科技 量子位当AI垂直落地健康领域,企业如何做出特色产品?在轻松健康集团技术副总裁高玉石的最新分享中,我们抓到了一个核心关键词:用户。在他看来,虽然当前用户对AI的接受度越来越高了,但用户也变得越来越理性了。这意味着,以前只要产品有趣好用,用户或许都愿意尝试一下。而现在,产品是否能在场景中有效...

可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题

4 月 23 日
阅读 3 分钟
131
关注前沿科技 量子位GPT-4o带火的漫画风角色生成,现在有了开源版啦!腾讯混元携手InstantX团队合作打破次元壁,开源定制化角色生成插件——InstantCharacter。以往针对角色驱动的图像生成方法,都存在一定的缺陷。例如,基于适配器的方案虽然基本实现主体一致和文本可控,但在泛化性、姿势变化和风格转换的开放域角色方面...

扩散模型还原被遮挡物体,几张稀疏照片也能"脑补"完整重建交互式3D场景|CVPR'25

4 月 23 日
阅读 4 分钟
136
在传统方法中,这几乎是不可能完成的任务,稀少的拍摄视角往往导致模型无法还原被遮挡的区域,生成的场景要么残缺不全,要么细节模糊。更令人困扰的是,传统的重建算法无法解耦场景中的独立物体,重建结果无法交互,严重限制了在具身智能、元宇宙和影视游戏等领域的应用前景。

量子位招聘 | DeepSeek帮我们改的招聘启事

4 月 23 日
阅读 3 分钟
120
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者

4 月 22 日
阅读 7 分钟
244
关注前沿科技 量子位新国产AI视频生成模型横空出世,一夜间全网刷屏。Magi-1,首个实现顶级画质输出的自回归视频生成模型,模型权重、代码100%开源。整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计,给人一种视频版DeepSeek的感觉。Magi-1将视频生成卷到了新高度,大片级品质直接锁住大家的眼球。...

数势科技谭李:企业级AI应用不止ChatBI,拿到数据不等于拿到洞见 | 中国AIGC产业峰会

4 月 22 日
阅读 5 分钟
134
关注前沿科技 量子位当大模型改变人类信息交互方式、算力成本不断降低,一个关键问题浮现在每一位企业决策者面前:如何让AI真正成为企业的“智慧大脑”,驱动业务决策全面升级?大模型来了,万物皆可Chat,但企业级AI应用的规范复杂得多,不是简单的Excel+Chat就能完成。在第三届AIGC产业峰会上,数势科技联合创始人谭李,...

3D高斯泼溅算法大漏洞:数据投毒让GPU显存暴涨70GB,甚至服务器宕机

4 月 22 日
阅读 5 分钟
142
随着3D Gaussian Splatting(3DGS)成为新一代高效三维建模技术,它的自适应特性却悄然埋下了安全隐患。在本篇 ICLR 2025 Spotlight 论文中,研究者们提出首个专门针对3DGS的攻击方法——Poison-Splat,通过对输入图像加入扰动,即可显著拖慢训练速度、暴涨显存占用,甚至导致系统宕机。这一攻击不仅隐蔽、可迁移,还在现...