量子位技术号 - SegmentFault 思否

巧妙！一个传统技术让国产视觉基础模型直接上大分

5 月 23 日

阅读 4 分钟

75

原创关注前沿科技量子位咱就是说啊，视觉基础模型这块儿，国产AI真就是上了个大分——Glint-MVT，来自格灵深瞳的最新成果。先来看下成绩——线性探测（LinearProbing）：简单来说，线性探测是一种测试预训练模型效果的小技巧，测的就是基本功扎不扎实。它的做法是：把模型最后一部分换成简单的线性层，其他部分全部保持原...

四位图灵奖掌舵，2025智源大会揭示AI进化新路径

量子位

5 月 23 日

阅读 2 分钟

48

2006年，多伦多大学Geoffrey Hinton教授等人提出逐层预训练方法，突破了深层神经网络训练的技术瓶颈，为深度学习的复兴奠定了基础。

多模态长文本理解测评首发：46款模型无一攻克128K难关

量子位

5 月 23 日

阅读 4 分钟

51

来自香港科技大学、腾讯西雅图AI Lab、爱丁堡大学、Miniml.AI、英伟达的研究者联合提出了MMLongBench，旨在全面评估多模态模型的长文本理解能力。

预测误差仅0.26mm，中科院自动化所×灵宝CASBOT团队让机器人提前“知道你要干嘛”

量子位

5 月 23 日

阅读 3 分钟

37

量子位以下文章来源于灵宝CASBOT ，作者灵宝CASBOT[灵宝CASBOT .Shaping Future Robotics.](#)在人与机器人愈发紧密协作的时代，如何让机器人“读懂”人类的意图、与人类默契配合，成为智能技术发展的关键一步。近日，由中国科学院自动化研究所与灵宝CASBOT共同提出的关于“增强物理人机协作中的人类意图估计和人机角色分配...

超长推理还能节省计算！Salesforce开源神器两连发：教大模型边想边省，显著提升数学编程准确率

量子位

5 月 23 日

阅读 3 分钟

51

Elastic Reasoning用“想多少、答多少”替代了“想到哪算哪”，让模型在预算范围内思考更合理，输出缩短30%，同时保持（甚至提高）了准确性。

量子位招聘 | DeepSeek帮我们改的招聘启事

量子位

5 月 23 日

阅读 3 分钟

44

关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具...

字节开源高精度文档解析大模型Dolphin：轻量高效，性能超GPT4.1、Mistral-OCR！

量子位

5 月 22 日

阅读 3 分钟

69

测试结果显示，Dolphin在文档解析任务上解析准确率超越了GPT-4.1、Claude3.5-Sonnet、Gemini2.5-pro、Qwen2.5-VL等通用多模态大模型，以及最近推出的号称最强OCR大模型的Mistral-OCR等垂类大模型。

小学数学题，大模型集体不及格！达摩院推出新基准VCBench

量子位

5 月 22 日

阅读 3 分钟

42

闭源模型中Gemini2.0-Flash（49.77%）、Qwen-VL-Max（47.03%）、Claude-3.7-Sonnet（46.63%）的综合表现最佳，但仍未突破50%准确率。

无需昂贵设备，单目方案生成超逼真3D头像，清华＆IDEA新研究入选CVPR2025

量子位

5 月 22 日

阅读 4 分钟

61

来自清华和IDEA的研究团队，联合开发了HRAvatar（High-Quality and Relightable Gaussian Head Avatar），一种基于单目视频的3D高斯头像重建方法。采用可学习形变基和线性蒙皮技术，实现灵活且精确的几何变形，并通过精准的表情编码器减少追踪误差，提升重建质量。

量子位招聘 | DeepSeek帮我们改的招聘启事

量子位

5 月 22 日

阅读 3 分钟

53

关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具...

腾讯大模型战略首次全景亮相！智能体平台重磅上线，从“落地可用”到“智能协同”

量子位

5 月 22 日

阅读 4 分钟

93

原创关注前沿科技量子位智能体的开发门槛，又又又被打下来了！昨天，腾讯云在他们的AI产业应用峰会上，正式上线了全新的智能体开发平台，率先在行业内实现零代码配置多智能体协同构建。除了上线智能体开发平台，腾讯云也对从AI Infra到模型到应用的整个体系来了波全面升级。包括混元系列大模型，也迎来了重磅更新。腾...

AI十周找到不治之症潜在新疗法，核心流程完全自主驱动

量子位

5 月 22 日

阅读 6 分钟

32

关注前沿科技量子位无特效疗法、无法根治的疾病，现在被「AI科学家」发现了潜在新疗法。核心流程完全由AI驱动，人类研究员仅执行了实验室实验和最终论文撰写的那种。最近非营利性组织Future House宣布了一个最新成果：可以致盲的眼部疾病——干性年龄相关性黄斑变性（dAMD），或许有救了。他们用一个多智能体系统，成功锁...

纯靠“脑补”图像，大模型推理准确率狂飙80%丨剑桥谷歌新研究

量子位

5 月 21 日

阅读 4 分钟

35

关注前沿科技量子位不再依赖语言，仅凭图像就能完成模型推理？大模型又双叒叕迎来新SOTA！当你和大模型一起玩超级玛丽时，复杂环境下你会根据画面在脑海里自动规划步骤，但LLMs还需要先转成文字攻略一格格按照指令移动，效率又低、信息也可能会丢失，那难道就没有一个可以跳过“语言中介”的方法吗？于是来自剑桥、伦敦大...

瘦身不降智！大模型训推效率提升30%，京东大模型开发计算研究登Nature旗下期刊

量子位

5 月 21 日

阅读 2 分钟

27

关注前沿科技量子位京东探索研究院关于大模型的最新研究，登上了Nature旗下期刊！该项研究提出了一种在开放环境场景中训练、更新大模型，并与小模型协同部署的系统与方法。它通过模型蒸馏、数据治理、训练优化与云边协同四大创新，这个项目将大模型推理效率平均提升30%，训练成本降低70%。这个名为《Omniforce：以人为...

企业把AI用起来，真的不是接入个DeepSeek就完事了

量子位

5 月 21 日

阅读 4 分钟

62

原创关注前沿科技量子位一个残酷的事实——企业内部跟上AI时代，真的不是选个模型来让大家用就完事了。如果只是喊口号让大家把AI用起来，结果往往是：接入了大模型，员工的工作方式还停留在上一个版本；模型能力在进步，但让它帮忙解决工作中遇到的问题，依旧答不到心坎上；信息还是乱、知识还是散、效率还是低。为什么...

搜索SEO被AI重塑，专业内容社区价值凸显 | 量子位智库报告

量子位

5 月 21 日

阅读 3 分钟

33

原创关注前沿科技量子位大模型颠覆传统搜索的风，已经吹到了商业化策略的层面。量子位智库最新报告发现：AI智能助手替代搜索的过程中，传统SEO也正在被重构。可以说，在互联网时代，SEO是搜索商业化环节中最基础、最重要的组成部分之一，也是提升互联网内容质量和体验的重要一环。量子位智库《AI智能助手的SEO策略变革...

ChatGPT转型计划曝光！不再只是回答问题，而是通过穿插使用工具变身行动助手

量子位

5 月 21 日

阅读 2 分钟

33

关注前沿科技量子位AI Agent今天是初级工程师，6个月后是高级工程师，一年后是架构师。这是OpenAI CPO Kevin Weil在接受最新访谈时提出的构想。他表示，ChatGPT将从回答问题转变为为用户做事。也就是说，AI Agent不再满足于30s回答问题，而是通过浏览网页、深度思考、推理总结以解决更复杂的问题。此外，他还提到当下模...

华为：让DeepSeek的“专家们”动起来，推理延迟降10%！

量子位

5 月 20 日

阅读 3 分钟

70

原创关注前沿科技量子位昨天的文章已经提到，昇腾超大规模MoE模型推理部署技术在本周会有持续的技术披露，果然第二天的技术报告又如期而至了。前情提要：《华为+DeepSeek，推理性能创新高！技术报告也公布出来了》要问最近哪个模型最火，混合专家模型（MoE，Mixture of Experts）绝对是榜上提名的那一个。它的巧妙之处...

智源3款向量模型发布！代码检索及多模态维度刷新多项SOTA

量子位

5 月 20 日

阅读 3 分钟

34

关注前沿科技量子位检索增强技术在代码及多模态场景中的发挥着重要作用，而向量模型是检索增强体系中的重要组成部分。针对这一需求，近日，智源研究院联合多所高校研发了三款向量模型，包括：代码向量模型BGE-Code-v1多模态向量模型BGE-VL-v1.5视觉化文档向量模型BGE-VL-Screenshot这些模型取得了代码及多模态检索的最...

UC伯克利5千美元造全开源人形机器人，网友：这作业抄定了

量子位

5 月 20 日

阅读 4 分钟

22

注意看，画面中这个正在认真写名字的小家伙，就是来自UC伯克利的最新作品——人形机器人Berkeley Humanoid Lite （BHL）。

手机流畅处理128K长文本，vivo端侧新算法突破内存限制 | ACL 2025

量子位

5 月 20 日

阅读 3 分钟

28

vivo AI研究院推出的EdgeInfinite算法专为端侧设备设计，让设备处理超长文本时更加高效流畅，该方法能够在不到10GB GPU内存的设备上处理长达128K tokens的输入。

量子位招聘 | DeepSeek帮我们改的招聘启事

量子位

5 月 20 日

阅读 3 分钟

24

关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具...

华为+DeepSeek，推理性能创新高！技术报告也公布出来了

量子位

5 月 19 日

阅读 5 分钟

86

原创关注前沿科技量子位部署超大规模MoE这件事，国产芯片的推理性能，已经再创新高了——不仅是“英伟达含量为0”这么简单，更是性能全面超越英伟达Hopper架构！而做到这一点的，正是华为昇腾；具体而言，共包含两个产品：CloudMatrix 384超节点部署DeepSeek V3/R1，在50ms时延约束下单卡Decode吞吐突破1920 Tokens/sAtlas...

OceanBase全面拥抱AI！首发PowerRAG产品，CTO杨传辉详解AI战略

量子位

5 月 19 日

阅读 4 分钟

28

关注前沿科技量子位全面拥抱AI之后，OceanBase首次详解了他们的战略。第三届开发者大会上，OceanBase发布了面向AI的应用产品PowerRAG——主打RAG开发能力开箱即用，打通应用开发数据层、平台层、接口层与应用层的全流程。它可以帮助用户实现文档知识库、智能对话、图像比对、数据分析等多种AI应用场景的快速开发。作为他...

全新GPU高速互联设计，为大模型训练降本增效！北大/阶跃/曦智提出新一代高带宽域架构

量子位

5 月 19 日

阅读 6 分钟

40

关注前沿科技量子位随着大模型的参数规模不断扩大，分布式训练已成为人工智能发展的中心技术路径。如此一来，高带宽域的设计对提升大模型训练效率至关重要。然而，现有的HBD架构在可扩展性、成本和容错能力等方面存在根本性限制：以交换机为中心的HBD（如NVIDIA NVL-72）成本高昂、不易扩展规模；以GPU为中心的HBD（如 ...

参数量暴降，精度反升！哈工大宾大联手打造点云分析新SOTA

量子位

5 月 19 日

阅读 4 分钟

30

来自哈尔滨工业大学（深圳）和宾夕法尼亚大学的联合团队最近推出了一种基于Kolmogorov-Arnold Networks(KANs)的3D感知解决方案——PointKAN，在处理点云数据的下游任务上展现出巨大的潜力。

量子位招聘 | DeepSeek帮我们改的招聘启事

量子位

5 月 19 日

阅读 3 分钟

31

关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具...

矩阵乘法可以算得更快了！港中文10页论文证明：能源、时间均可节省

量子位

5 月 18 日

阅读 3 分钟

123

原创关注前沿科技量子位天下苦大模型矩阵乘法久矣。毕竟不论是训练还是推理过程，矩阵乘法作为最主要的计算操作之一，往往都需要消耗大量的算力。那么就没有一种更“快、好、省”的方法来搞这事儿吗？有的，香港中文大学最新一篇仅10页的论文，便提出了一种新算法：能源可节省：5%-10%时间可节省：5%论文作者之一的Dmitr...

量子位招聘 | DeepSeek帮我们改的招聘启事

量子位

5 月 18 日

阅读 3 分钟

116

关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具...

经典教材《泛函分析》作者逝世，享年99岁：首位获阿贝尔奖的应用数学家

量子位

5 月 18 日

阅读 4 分钟

249

原创关注前沿科技量子位史上首位获得阿贝尔奖（数学界诺奖）的应用数学家Peter Lax（彼得·拉克斯）逝世了，享年99岁。或许你对这个名字不太熟悉，但你很可能学过他编写的那个经典教材——《泛函分析》。纵观他的一生，拉克斯可以说是站在理论数学和应用数学交叉点的巨匠。同时，他也是最早将计算机技术应用于数学分析的...