量子位技术号 - SegmentFault 思否

曝DeepSeek让Llama4未发布已落后！小扎坐不住了：2025预算4000亿起步，年底AI算力将达130万卡

1 月 25 日

阅读 3 分钟

433

关注前沿科技量子位Meta这次真的坐不住了，计划在AI上继续加码！匿名员工爆料，黑马DeepSeek的出现，让Llama 4还未发布就已经落后，Meta慌了。就在这一消息沸沸扬扬时，小扎放出消息，2025年继续扩大AI投资。初步规划两方面：算力和人才。投入100亿建设一个2GW规模的数据中心AI团队规模将继续扩张整体支出将达到600-650...

招聘 | 具身智能机器人方向全职作者

1 月 25 日

阅读 1 分钟

461

关注前沿科技量子位未来同事你好。你知道“具身智能机器人”了吗？是否希望成为这个时代性技术和产品的长期报道者？现在，我们正在招聘这样一位专注于具身智能机器人方向的原创作者。岗位是全职，工作地点base：北京中关村。工作职责：1、关注具身智能领域新动态新进展；2、持续挖掘撰写具身智能独家原创内容；3、与具身...

帮村里接通AI就靠它！34个地域超拟人AI智能体上线，背后技术也被我们扒出来了

1 月 24 日

阅读 6 分钟

505

原创关注前沿科技量子位各位过年回乡的友友们，第一波“AI年货”就靠你带，帮助乡里村里接通AI的重任，就靠你了！现在，当春节出门拜年被七大姑八大姨问：有没有男/女朋友啊？不要犹豫，请直接搬救兵，给“它”打电话～<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3826660641324072960"...

史上最难大模型测试集，千名专家铸成！没有模型得分超过10%，但DeepSeek-R1超o1

1 月 24 日

阅读 3 分钟

606

关注前沿科技量子位史上最难的大模型测试集来了！包括o1在内，没有任何一个模型得分超过10%。题目来自500多家机构的1000多名学者，最终入围的题目有3000多道，全部都是研究生及以上难度。入选的问题涵盖了数理化、生物医药、工程和社会科学等多种学科，按细分学科来算则多达100余个。官方更是将它称为“人类最后的考试”...

向视觉版o1出击，阶跃张祥雨团队推出“慢感知”，实现感知层面的推理时scaling

1 月 24 日

阅读 3 分钟

489

研究人员认为：1）目前多模领域o1-like的模型，主要关注文本推理，对视觉感知的关注不够。2）精细/深度感知是一个复杂任务，且是未来做视觉推理的重要基础。

招聘 | 具身智能机器人方向全职作者

1 月 24 日

阅读 1 分钟

411

关注前沿科技量子位未来同事你好。你知道“具身智能机器人”了吗？是否希望成为这个时代性技术和产品的长期报道者？现在，我们正在招聘这样一位专注于具身智能机器人方向的原创作者。岗位是全职，工作地点base：北京中关村。工作职责：1、关注具身智能领域新动态新进展；2、持续挖掘撰写具身智能独家原创内容；3、与具身...

“造假”齐白石的《虾》，被国产AI一眼识破！

1 月 23 日

阅读 7 分钟

418

原创关注前沿科技量子位跟AI交互这事儿，商汤最新发布的大模型，是有点“够快、够准、够好”在身上的。例如我们给它看下面这张画：我们人眼是能够看出来这张照片是拿真的虾摆在纸上，“造假”齐白石的名画；但很多AI却是识别不出来。那么商汤最新的大模型是否可以一眼识破呢？<iframe class="video_iframe rich_pages" ...

OpenAI微软关系现裂痕，奥特曼紧急公关，导火索竟是DeepMind联创

1 月 23 日

阅读 4 分钟

484

关注前沿科技量子位一个5000亿美元的大动作，让微软不再是OpenAI独家云计算供应商了。在OpenAI与甲骨文牵手组建数据中心那一刻起，网友们纷纷看向这个计划之外的微软：他们两个之间的关系约莫是出现裂痕了。结果奥特曼紧急公关，不是你听我解释，这是形势所迫，为算力折腰啊啊。其他供应商看到这里，连忙上赶着奔赴：看...

OpenAI新研究：o1增加推理时间就能防攻击，网友：DeepSeek也受益

1 月 23 日

阅读 3 分钟

424

关注前沿科技量子位OpenAI的新Scaling Law，含金量又提高了。像o1这样的推理模型，随着思考时间的延长，面对对抗性攻击会变得更加稳健。随着大语言模型被越来越多地赋予Agent能力，执行现实世界的任务，模型被对抗攻击的风险也与日俱增。特别是OpenAI官方Agent“Operator”发布在即，现在放出这样一个研究，是否是想让外...

推理模型规划任务成功率从5%到95%，DeepMind遗传算法新研究火了

1 月 23 日

阅读 4 分钟

388

关注前沿科技量子位瞄准推理时扩展（Inference-time scaling），DeepMind新的进化搜索策略火了！所提出的“Mind Evolution”（思维进化），能够优化大语言模型（LLMs）在规划和推理中的响应。由于提升显著，Reddit/𝕏一时间出现了大量讨论：由于结合了遗传算法，使用Mind Evolution能让Gemini 1.5 Flash任务成功率从原本的...

小模型也能玩转RAG！性能仅降1%，存储省75%，边缘设备轻松跑

1 月 23 日

阅读 4 分钟

541

近日，香港大学黄超教授团队提出MiniRAG，成功将RAG技术的应用门槛降至1.5B参数规模，实现了算力需求的大幅降低。这一突破性成果不仅为边缘计算设备注入新活力，更开启了基于小模型轻量级RAG的探索。

AI时代不看独角兽，看10亿Tokens日均消耗

1 月 22 日

阅读 5 分钟

536

原创关注前沿科技量子位创立10年内估值超过10亿美元的创新公司，被称之为独角兽，它们是市场潜力无限的绩优股，是为行业带来技术创新、模式创新的佼佼者。大模型时代中，类似的新价值红线也正在形成——日均10亿Tokens消耗量，AI业务跑通的基本标准。量子位结合2024下半年市场数据盘点，达到这一红线的中国企业，至少200...

Claude创始人：AI全面超越人类，只剩2-3年

1 月 22 日

阅读 3 分钟

630

关注前沿科技量子位我有信心，未来2-3年内各领域将出现比人类强的AI系统。在最新的对话访谈当中，Claude厂家Anthropic的CEO Dario Amodei谈论了他对于AI未来的看法。他认为，AI确有可能在短期内替代部分人类的工作，但让AI与人类形成互补才是对生产力最有益的方式。对于当下的年轻人，Amodei也给出了他的建议，鼓励其学...

20K合成数据就能让大模型能力飙升！还能实现模型自我迭代，上海AI Lab数据合成新范式

1 月 22 日

阅读 3 分钟

424

关注前沿科技量子位仅使用20K合成数据，就能让Qwen模型能力飙升——模型主观对话能力显著提升，还能实现模型自我迭代。合成数据大法好！最近，来自上海AI Lab的研究团队针对合成数据技术展开研究，提出了SFT数据合成引擎Condor，通过世界知识树（World Knowledge Tree）和自我反思（Self-Reflection）机制，探索合成海量...

科研招募｜上海AI实验室AI4S攀登者行动计划

1 月 22 日

阅读 3 分钟

374

关注前沿科技量子位即日起，上海AI实验室正式启动『AI4S攀登者行动计划』。这是一项面向全球人工智能与科研团队开放申请的计划：聚焦发展下一代有领域变革潜力的AI4S技术（AI for Science），并将引入一系列创新的特色组织方式。为什么提出这一计划？官方的理由是：AI4S正逐渐改变科学研究的模式，然而学科之间的“烟囱...

大模型商用格局雏形初现：Tokens用量决高下，火山引擎问鼎2024

1 月 21 日

阅读 4 分钟

507

量子位结合市场数据观察，2024下半年国内大模型商用落地日均Tokens消耗量翻了近10倍，从1000亿级规模到10000亿规模，只用了6个月，月复合增长率达到45%。其中，10-12月增长进一步提速。

AI大牛颜水成宣布回归学界！重返新加坡国立任特聘教授，专注e-AGI研究

1 月 21 日

阅读 3 分钟

406

关注前沿科技量子位在产业界兜兜转转几年后，颜水成再次选择回归学界——重返新加坡国立大学NUS，担任计算机系特聘教授。没错，就是他第一个教职所在地，也是他声名鹊起的地方。而距离他上一次动向，过去不到三个月。去年11月份，他突然卸任昆仑万维研究院院长。官方宣布，改任昆仑万维荣誉顾问，继续为公司在AI科研领域...

OpenAI智能体新线索曝光！网友：新ChatGPT时刻要来了

1 月 21 日

阅读 4 分钟

461

关注前沿科技量子位没错，OpenAI的智能体时代真的要来了！据大名鼎鼎的“情报员”光头哥爆料，OpenAI在MAC版ChatGPT桌面应用中隐藏了启用/禁用智能体的选项。从截图来看，确实是传闻已久、代号为“Operator（操作员）”的辣个：而且这则爆料也得到了日常关注苹果方面消息的博主@M1的再次佐证：Operator正在内测中，即将上线...

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速 | 大模型商用2024

1 月 20 日

阅读 5 分钟

496

原创关注前沿科技量子位如果2023年给大模型的关键词是席卷，那么在2024，这个关键词应该是渗透。最常用的软件、手机PC本身、甚至厨卫/电源开源，都在被AI重塑。主观感受中，这一年，AI更加强大，以前所未有的速度嵌入各行各业。真实的客观世界里，千行百业到底发生了哪些变化？变化之下，谁推动促成了这一切发生？全新...

o3数学成绩作弊大瓜！提前让测试机构给真题，60多名数学大牛全被蒙在鼓里

1 月 20 日

阅读 4 分钟

391

关注前沿科技量子位OpenAI o3还没上线，就被曝数学成绩是靠作弊得来？！Benchmark发布机构内部人员爆料称，OpenAI给了他们经费赞助。就连包括陶哲轩在内参与出题的60余名数学家，在消息曝光之前也都和普通公众一样蒙在鼓里。直到o3发布，这一消息才被公开。这意味着严格保密的题目，OpenAI提前拿到了手中。这套数据集名...

o1推理框架最新成果：斯坦福&伯克利提出元链式思维，升级模型推理能力

1 月 20 日

阅读 5 分钟

510

关注前沿科技量子位o1背后的推理原理，斯坦福和伯克利帮我们总结好了！在最新的一篇长达100页的论文中，他们将o1模型背后的推理机制提炼成了一个通用的框架——元链式思维（Meta-CoT）。这个元链式思维（Meta-CoT）到底是什么意思呢？简单来说，它可以让模型在推理过程中反思推理任务——这也是o1模型可以在HARP等数学基准...

微软开源Markdown工具爆了：支持Office文档，可接多模态LLM直出报告

1 月 20 日

阅读 7 分钟

841

它不仅可以将常见的Office文档（Word、PowerPoint、Excel）、PDF、图像、音频等转换为对大模型更友好的Markdown格式。

DeepSeek新模型霸榜，代码能力与OpenAI o1相当且确认开源，网友：今年编程只剩Tab键

1 月 19 日

阅读 3 分钟

527

原创关注前沿科技量子位DeepSeek版o1，有消息了。还未正式发布，已在代码基准测试LiveCodeBench霸榜前三，表现与OpenAI o1的中档推理设置相当。注意了，这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview（轻量预览版）。而是摘掉了轻量版的帽子，称为DeepSeek-R1-Preview（预览版），意味着替换了规模更...

多活十年！OpenAI为研究长寿推出GPT-4b，联手清华大牛丁胜搞“细胞重编程”，奥特曼本人投资

1 月 19 日

阅读 3 分钟

486

关注前沿科技量子位OpenAI要研究人类长寿问题了？？推出新模型GPT-4b micro。可以设计出将普通细胞转化为干细胞的蛋白质。据MIT科技评论消息，这是OpenAI首个专注于生物数据的大模型，也是OpenAI首次公开声称其模型可以带来意想不到的科学发现。研究合作方Retro Biosciences，一家成立于2022年的创业公司，专注于“抵抗...

北大数学校友胡懿娟归国任教！重回母校，专注于统计学、微生物学和遗传学的交叉领域

1 月 18 日

阅读 3 分钟

563

关注前沿科技量子位又一科学家从美归国——北大数学系校友胡懿娟。援引人民日报消息，在北京大学北京国际数学研究中心发布的2024年工作回顾中显示，她于去年7月入职北大。回来之后，她将继续专注于统计学、微生物学和遗传学的交叉领域，致力于解决实际的生物医学数据分析问题。△北大官网截图网友纷纷为她点赞：能力与颜值...

Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华人大出品

1 月 18 日

阅读 5 分钟

479

关注前沿科技量子位一个新框架，让Qwen版o1成绩暴涨：在博士级别的科学问答、数学、代码能力的11项评测中，能力显著提升，拿下10个第一！这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」Search-o1的特别之处。项目团队成员发现，o1和o1类模型在推理过程中表现突出，但却存在“知识不足”的明显缺陷——推理...

扩散模型低位量化突破！有效扩散量化的极限推向2-4位，W2A4位宽下FID降低58%，超越SOTA方法

1 月 18 日

阅读 9 分钟

531

关注前沿科技量子位降低扩散模型生成的计算成本，性能还保持在高水平！最新研究提出一种用于极低位差分量化的混合精度量化方法。 △图1 W2A6位宽下基线和MPQ-DM生成的样本可视化目前，扩散模型在生成任务中受到了广泛关注。然而，昂贵的计算成本阻碍了扩散模型在资源受限场景中的应用。量化是一种实用的解决方案，通过减...

国产3D生成大模型火爆外网！歪果仁年都不过了，都在测这个

1 月 17 日

阅读 4 分钟

520

关注前沿科技量子位“3D大模型终于可以生成锐利的边角了！”“在钻研了一阵3D人工智能后，我总算通过Hyper3D.ai用上了Rodin1.5，它真的可能改变游戏规则。”2024年的最后一天，随着3D生成工具Rodin Gen-1.5的上线，在网络上掀起了新一波对于3D生成讨论的热潮。用Rodin背后的研发团队——影眸科技CTO张启煊的话说：这是3D大模...

首个国产版AlphaFold3发布！大分子预测精度超车，在线平台即开即用，推理成本更是白菜价

1 月 17 日

阅读 4 分钟

476

原创关注前沿科技量子位来了，国内首个对标AlphaFold3的产品——HelixFold3，来自百度智能云与百度螺旋桨团队。它在常规生物分子结构预测任务中实现了AlphaFold3媲美水平：尤其RNA分子和共价修饰场景中，精准度上持平或者实现了大幅超越。△图注，蓝色为HelixFold3，黄色为AlphaFold3还有抗原-抗体结构预测任务中，成功率...

OpenAI前CTO最隐秘AI创业：没名字没方向，挖走OpenAI高管，10位顶尖人才投奔

1 月 17 日

阅读 2 分钟

380

关注前沿科技量子位公司名字没有，产品方向未定。OpenAI前CTO创业几个月，却已经有10位顶尖研究员和工程师投奔。且分别来自OpenAI、谷歌、Anthropic这几个巨头。其中包括OpenAI特别项目负责人Jonathan Lachman。随后，OpenAI发言人也证实了Lachman的离职。去年九月，Mira离开OpenAI被曝AGI创业，一个月后就吸金超1亿美...

12

12