巧妙!一个传统技术让国产视觉基础模型直接上大分

5 月 23 日
阅读 4 分钟
75
原创 关注前沿科技 量子位咱就是说啊,视觉基础模型这块儿,国产AI真就是上了个大分——Glint-MVT,来自格灵深瞳的最新成果。先来看下成绩——线性探测(LinearProbing):简单来说,线性探测是一种测试预训练模型效果的小技巧,测的就是基本功扎不扎实。它的做法是:把模型最后一部分换成简单的线性层,其他部分全部保持原...

四位图灵奖掌舵,2025智源大会揭示AI进化新路径

5 月 23 日
阅读 2 分钟
48
2006年,多伦多大学Geoffrey Hinton教授等人提出逐层预训练方法,突破了深层神经网络训练的技术瓶颈,为深度学习的复兴奠定了基础。

多模态长文本理解测评首发:46款模型无一攻克128K难关

5 月 23 日
阅读 4 分钟
51
来自香港科技大学、腾讯西雅图AI Lab、爱丁堡大学、Miniml.AI、英伟达的研究者联合提出了MMLongBench,旨在全面评估多模态模型的长文本理解能力。

预测误差仅0.26mm,中科院自动化所×灵宝CASBOT团队让机器人提前“知道你要干嘛”

5 月 23 日
阅读 3 分钟
37
量子位以下文章来源于灵宝CASBOT ,作者灵宝CASBOT[灵宝CASBOT .Shaping Future Robotics.](#)在人与机器人愈发紧密协作的时代,如何让机器人“读懂”人类的意图、与人类默契配合,成为智能技术发展的关键一步。近日,由中国科学院自动化研究所与灵宝CASBOT共同提出的关于“增强物理人机协作中的人类意图估计和人机角色分配...

超长推理还能节省计算!Salesforce开源神器两连发:教大模型边想边省,显著提升数学编程准确率

5 月 23 日
阅读 3 分钟
51
Elastic Reasoning用“想多少、答多少”替代了“想到哪算哪”,让模型在预算范围内思考更合理,输出缩短30%,同时保持(甚至提高)了准确性。

量子位招聘 | DeepSeek帮我们改的招聘启事

5 月 23 日
阅读 3 分钟
44
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

字节开源高精度文档解析大模型Dolphin:轻量高效,性能超GPT4.1、Mistral-OCR!

5 月 22 日
阅读 3 分钟
69
测试结果显示,Dolphin在文档解析任务上解析准确率超越了GPT-4.1、Claude3.5-Sonnet、Gemini2.5-pro、Qwen2.5-VL等通用多模态大模型,以及最近推出的号称最强OCR大模型的Mistral-OCR等垂类大模型。

小学数学题,大模型集体不及格!达摩院推出新基准VCBench

5 月 22 日
阅读 3 分钟
42
闭源模型中Gemini2.0-Flash(49.77%)、Qwen-VL-Max(47.03%)、Claude-3.7-Sonnet(46.63%)的综合表现最佳,但仍未突破50%准确率。

无需昂贵设备,单目方案生成超逼真3D头像,清华&IDEA新研究入选CVPR2025

5 月 22 日
阅读 4 分钟
61
来自清华和IDEA的研究团队,联合开发了HRAvatar(High-Quality and Relightable Gaussian Head Avatar),一种基于单目视频的3D高斯头像重建方法。采用可学习形变基和线性蒙皮技术,实现灵活且精确的几何变形,并通过精准的表情编码器减少追踪误差,提升重建质量。

量子位招聘 | DeepSeek帮我们改的招聘启事

5 月 22 日
阅读 3 分钟
53
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

腾讯大模型战略首次全景亮相!智能体平台重磅上线,从“落地可用”到“智能协同”

5 月 22 日
阅读 4 分钟
93
原创 关注前沿科技 量子位智能体的开发门槛,又又又被打下来了!昨天,腾讯云在他们的AI产业应用峰会上,正式上线了全新的智能体开发平台,率先在行业内实现零代码配置多智能体协同构建。除了上线智能体开发平台,腾讯云也对从AI Infra到模型到应用的整个体系来了波全面升级。包括混元系列大模型,也迎来了重磅更新。腾...

AI十周找到不治之症潜在新疗法,核心流程完全自主驱动

5 月 22 日
阅读 6 分钟
32
关注前沿科技 量子位无特效疗法、无法根治的疾病,现在被「AI科学家」发现了潜在新疗法。核心流程完全由AI驱动,人类研究员仅执行了实验室实验和最终论文撰写的那种。最近非营利性组织Future House宣布了一个最新成果:可以致盲的眼部疾病——干性年龄相关性黄斑变性(dAMD),或许有救了。他们用一个多智能体系统,成功锁...

纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究

5 月 21 日
阅读 4 分钟
35
关注前沿科技 量子位不再依赖语言,仅凭图像就能完成模型推理?大模型又双叒叕迎来新SOTA!当你和大模型一起玩超级玛丽时,复杂环境下你会根据画面在脑海里自动规划步骤,但LLMs还需要先转成文字攻略一格格按照指令移动,效率又低、信息也可能会丢失,那难道就没有一个可以跳过“语言中介”的方法吗?于是来自剑桥、伦敦大...

瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊

5 月 21 日
阅读 2 分钟
27
关注前沿科技 量子位京东探索研究院关于大模型的最新研究,登上了Nature旗下期刊!该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法。它通过模型蒸馏、数据治理、训练优化与云边协同四大创新,这个项目将大模型推理效率平均提升30%,训练成本降低70%。这个名为《Omniforce:以人为...

企业把AI用起来,真的不是接入个DeepSeek就完事了

5 月 21 日
阅读 4 分钟
62
原创 关注前沿科技 量子位一个残酷的事实——企业内部跟上AI时代,真的不是选个模型来让大家用就完事了。如果只是喊口号让大家把AI用起来,结果往往是:接入了大模型,员工的工作方式还停留在上一个版本;模型能力在进步,但让它帮忙解决工作中遇到的问题,依旧答不到心坎上;信息还是乱、知识还是散、效率还是低。为什么...

搜索SEO被AI重塑,专业内容社区价值凸显 | 量子位智库报告

5 月 21 日
阅读 3 分钟
33
原创 关注前沿科技 量子位大模型颠覆传统搜索的风,已经吹到了商业化策略的层面。量子位智库最新报告发现:AI智能助手替代搜索的过程中,传统SEO也正在被重构。可以说,在互联网时代,SEO是搜索商业化环节中最基础、最重要的组成部分之一,也是提升互联网内容质量和体验的重要一环。量子位智库《AI智能助手的SEO策略变革...

ChatGPT转型计划曝光!不再只是回答问题,而是通过穿插使用工具变身行动助手

5 月 21 日
阅读 2 分钟
33
关注前沿科技 量子位AI Agent今天是初级工程师,6个月后是高级工程师,一年后是架构师。这是OpenAI CPO Kevin Weil在接受最新访谈时提出的构想。他表示,ChatGPT将从回答问题转变为为用户做事。也就是说,AI Agent不再满足于30s回答问题,而是通过浏览网页、深度思考、推理总结以解决更复杂的问题。此外,他还提到当下模...

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

5 月 20 日
阅读 3 分钟
70
原创 关注前沿科技 量子位昨天的文章已经提到,昇腾超大规模MoE模型推理部署技术在本周会有持续的技术披露,果然第二天的技术报告又如期而至了。前情提要:《华为+DeepSeek,推理性能创新高!技术报告也公布出来了》要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。它的巧妙之处...

智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA

5 月 20 日
阅读 3 分钟
34
关注前沿科技 量子位检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括:代码向量模型BGE-Code-v1多模态向量模型BGE-VL-v1.5视觉化文档向量模型BGE-VL-Screenshot这些模型取得了代码及多模态检索的最...

UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了

5 月 20 日
阅读 4 分钟
22
注意看,画面中这个正在认真写名字的小家伙,就是来自UC伯克利的最新作品——人形机器人Berkeley Humanoid Lite (BHL)。

手机流畅处理128K长文本,vivo端侧新算法突破内存限制 | ACL 2025

5 月 20 日
阅读 3 分钟
28
vivo AI研究院推出的EdgeInfinite算法专为端侧设备设计,让设备处理超长文本时更加高效流畅,该方法能够在不到10GB GPU内存的设备上处理长达128K tokens的输入。

量子位招聘 | DeepSeek帮我们改的招聘启事

5 月 20 日
阅读 3 分钟
24
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

华为+DeepSeek,推理性能创新高!技术报告也公布出来了

5 月 19 日
阅读 5 分钟
86
原创 关注前沿科技 量子位部署超大规模MoE这件事,国产芯片的推理性能,已经再创新高了——不仅是“英伟达含量为0”这么简单,更是性能全面超越英伟达Hopper架构!而做到这一点的,正是华为昇腾;具体而言,共包含两个产品:CloudMatrix 384超节点部署DeepSeek V3/R1,在50ms时延约束下单卡Decode吞吐突破1920 Tokens/sAtlas...

OceanBase全面拥抱AI!首发PowerRAG产品,CTO杨传辉详解AI战略

5 月 19 日
阅读 4 分钟
28
关注前沿科技 量子位全面拥抱AI之后,OceanBase首次详解了他们的战略。第三届开发者大会上,OceanBase发布了面向AI的应用产品PowerRAG——主打RAG开发能力开箱即用,打通应用开发数据层、平台层、接口层与应用层的全流程。它可以帮助用户实现文档知识库、智能对话、图像比对、数据分析等多种AI应用场景的快速开发。作为他...

全新GPU高速互联设计,为大模型训练降本增效!北大/阶跃/曦智提出新一代高带宽域架构

5 月 19 日
阅读 6 分钟
40
关注前沿科技 量子位随着大模型的参数规模不断扩大,分布式训练已成为人工智能发展的中心技术路径。如此一来,高带宽域的设计对提升大模型训练效率至关重要。然而,现有的HBD架构在可扩展性、成本和容错能力等方面存在根本性限制:以交换机为中心的HBD(如NVIDIA NVL-72)成本高昂、不易扩展规模;以GPU为中心的HBD(如 ...

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

5 月 19 日
阅读 4 分钟
30
来自哈尔滨工业大学(深圳)和宾夕法尼亚大学的联合团队最近推出了一种基于Kolmogorov-Arnold Networks(KANs)的3D感知解决方案——PointKAN,在处理点云数据的下游任务上展现出巨大的潜力。

量子位招聘 | DeepSeek帮我们改的招聘启事

5 月 19 日
阅读 3 分钟
31
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

5 月 18 日
阅读 3 分钟
123
原创 关注前沿科技 量子位天下苦大模型矩阵乘法久矣。毕竟不论是训练还是推理过程,矩阵乘法作为最主要的计算操作之一,往往都需要消耗大量的算力。那么就没有一种更“快、好、省”的方法来搞这事儿吗?有的,香港中文大学最新一篇仅10页的论文,便提出了一种新算法:能源可节省:5%-10%时间可节省:5%论文作者之一的Dmitr...

量子位招聘 | DeepSeek帮我们改的招聘启事

5 月 18 日
阅读 3 分钟
116
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

经典教材《泛函分析》作者逝世,享年99岁:首位获阿贝尔奖的应用数学家

5 月 18 日
阅读 4 分钟
249
原创 关注前沿科技 量子位史上首位获得阿贝尔奖(数学界诺奖)的应用数学家Peter Lax(彼得·拉克斯)逝世了,享年99岁。或许你对这个名字不太熟悉,但你很可能学过他编写的那个经典教材——《泛函分析》。纵观他的一生,拉克斯可以说是站在理论数学和应用数学交叉点的巨匠。同时,他也是最早将计算机技术应用于数学分析的...