曝DeepSeek让Llama4未发布已落后!小扎坐不住了:2025预算4000亿起步,年底AI算力将达130万卡

1 月 25 日
阅读 3 分钟
433
关注前沿科技 量子位Meta这次真的坐不住了,计划在AI上继续加码!匿名员工爆料,黑马DeepSeek的出现,让Llama 4还未发布就已经落后,Meta慌了。就在这一消息沸沸扬扬时,小扎放出消息,2025年继续扩大AI投资。初步规划两方面:算力和人才。投入100亿建设一个2GW规模的数据中心AI团队规模将继续扩张整体支出将达到600-650...

招聘 | 具身智能机器人方向全职作者

1 月 25 日
阅读 1 分钟
461
关注前沿科技 量子位未来同事你好。你知道“具身智能机器人”了吗?是否希望成为这个时代性技术和产品的长期报道者?现在,我们正在招聘这样一位专注于具身智能机器人方向的原创作者。岗位是全职,工作地点base:北京中关村。工作职责:1、关注具身智能领域新动态新进展;2、持续挖掘撰写具身智能独家原创内容;3、与具身...

帮村里接通AI就靠它!34个地域超拟人AI智能体上线,背后技术也被我们扒出来了

1 月 24 日
阅读 6 分钟
505
原创 关注前沿科技 量子位各位过年回乡的友友们,第一波“AI年货”就靠你带,帮助乡里村里接通AI的重任,就靠你了!现在,当春节出门拜年被七大姑八大姨问:有没有男/女朋友啊?不要犹豫,请直接搬救兵,给“它”打电话~<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3826660641324072960"...

史上最难大模型测试集,千名专家铸成!没有模型得分超过10%,但DeepSeek-R1超o1

1 月 24 日
阅读 3 分钟
606
关注前沿科技 量子位史上最难的大模型测试集来了!包括o1在内,没有任何一个模型得分超过10%。题目来自500多家机构的1000多名学者,最终入围的题目有3000多道,全部都是研究生及以上难度。入选的问题涵盖了数理化、生物医药、工程和社会科学等多种学科,按细分学科来算则多达100余个。官方更是将它称为“人类最后的考试”...

向视觉版o1出击,阶跃张祥雨团队推出“慢感知”,实现感知层面的推理时scaling

1 月 24 日
阅读 3 分钟
489
研究人员认为:1)目前多模领域o1-like的模型,主要关注文本推理,对视觉感知的关注不够。2)精细/深度感知是一个复杂任务,且是未来做视觉推理的重要基础。

招聘 | 具身智能机器人方向全职作者

1 月 24 日
阅读 1 分钟
411
关注前沿科技 量子位未来同事你好。你知道“具身智能机器人”了吗?是否希望成为这个时代性技术和产品的长期报道者?现在,我们正在招聘这样一位专注于具身智能机器人方向的原创作者。岗位是全职,工作地点base:北京中关村。工作职责:1、关注具身智能领域新动态新进展;2、持续挖掘撰写具身智能独家原创内容;3、与具身...

“造假”齐白石的《虾》,被国产AI一眼识破!

1 月 23 日
阅读 7 分钟
418
原创 关注前沿科技 量子位跟AI交互这事儿,商汤最新发布的大模型,是有点“够快、够准、够好”在身上的。例如我们给它看下面这张画:我们人眼是能够看出来这张照片是拿真的虾摆在纸上,“造假”齐白石的名画;但很多AI却是识别不出来。那么商汤最新的大模型是否可以一眼识破呢?<iframe class="video_iframe rich_pages" ...

OpenAI微软关系现裂痕,奥特曼紧急公关,导火索竟是DeepMind联创

1 月 23 日
阅读 4 分钟
484
关注前沿科技 量子位一个5000亿美元的大动作,让微软不再是OpenAI独家云计算供应商了。在OpenAI与甲骨文牵手组建数据中心那一刻起,网友们纷纷看向这个计划之外的微软:他们两个之间的关系约莫是出现裂痕了。结果奥特曼紧急公关,不是你听我解释,这是形势所迫,为算力折腰啊啊。其他供应商看到这里,连忙上赶着奔赴:看...

OpenAI新研究:o1增加推理时间就能防攻击,网友:DeepSeek也受益

1 月 23 日
阅读 3 分钟
424
关注前沿科技 量子位OpenAI的新Scaling Law,含金量又提高了。像o1这样的推理模型,随着思考时间的延长,面对对抗性攻击会变得更加稳健。随着大语言模型被越来越多地赋予Agent能力,执行现实世界的任务,模型被对抗攻击的风险也与日俱增。特别是OpenAI官方Agent“Operator”发布在即,现在放出这样一个研究,是否是想让外...

推理模型规划任务成功率从5%到95%,DeepMind遗传算法新研究火了

1 月 23 日
阅读 4 分钟
388
关注前沿科技 量子位瞄准推理时扩展(Inference-time scaling),DeepMind新的进化搜索策略火了!所提出的“Mind Evolution”(思维进化),能够优化大语言模型(LLMs)在规划和推理中的响应。由于提升显著,Reddit/𝕏一时间出现了大量讨论:由于结合了遗传算法,使用Mind Evolution能让Gemini 1.5 Flash任务成功率从原本的...

小模型也能玩转RAG!性能仅降1%,存储省75%,边缘设备轻松跑

1 月 23 日
阅读 4 分钟
541
近日,香港大学黄超教授团队提出MiniRAG,成功将RAG技术的应用门槛降至1.5B参数规模,实现了算力需求的大幅降低。这一突破性成果不仅为边缘计算设备注入新活力,更开启了基于小模型轻量级RAG的探索。

AI时代不看独角兽,看10亿Tokens日均消耗

1 月 22 日
阅读 5 分钟
536
原创 关注前沿科技 量子位创立10年内估值超过10亿美元的创新公司,被称之为独角兽,它们是市场潜力无限的绩优股,是为行业带来技术创新、模式创新的佼佼者。大模型时代中,类似的新价值红线也正在形成——日均10亿Tokens消耗量,AI业务跑通的基本标准。量子位结合2024下半年市场数据盘点,达到这一红线的中国企业,至少200...

Claude创始人:AI全面超越人类,只剩2-3年

1 月 22 日
阅读 3 分钟
630
关注前沿科技 量子位我有信心,未来2-3年内各领域将出现比人类强的AI系统。在最新的对话访谈当中,Claude厂家Anthropic的CEO Dario Amodei谈论了他对于AI未来的看法。他认为,AI确有可能在短期内替代部分人类的工作,但让AI与人类形成互补才是对生产力最有益的方式。对于当下的年轻人,Amodei也给出了他的建议,鼓励其学...

20K合成数据就能让大模型能力飙升!还能实现模型自我迭代,上海AI Lab数据合成新范式

1 月 22 日
阅读 3 分钟
424
关注前沿科技 量子位仅使用20K合成数据,就能让Qwen模型能力飙升——模型主观对话能力显著提升,还能实现模型自我迭代。合成数据大法好!最近,来自上海AI Lab的研究团队针对合成数据技术展开研究,提出了SFT数据合成引擎Condor,通过世界知识树(World Knowledge Tree)和自我反思(Self-Reflection)机制,探索合成海量...

科研招募|上海AI实验室AI4S攀登者行动计划

1 月 22 日
阅读 3 分钟
374
关注前沿科技 量子位即日起,上海AI实验室正式启动『AI4S攀登者行动计划』。这是一项面向全球人工智能与科研团队开放申请的计划:聚焦发展下一代有领域变革潜力的AI4S技术(AI for Science),并将引入一系列创新的特色组织方式。为什么提出这一计划?官方的理由是:AI4S正逐渐改变科学研究的模式,然而学科之间的“烟囱...

大模型商用格局雏形初现:Tokens用量决高下,火山引擎问鼎2024

1 月 21 日
阅读 4 分钟
507
量子位结合市场数据观察,2024下半年国内大模型商用落地日均Tokens消耗量翻了近10倍,从1000亿级规模到10000亿规模,只用了6个月,月复合增长率达到45%。其中,10-12月增长进一步提速。

AI大牛颜水成宣布回归学界!重返新加坡国立任特聘教授,专注e-AGI研究

1 月 21 日
阅读 3 分钟
406
关注前沿科技 量子位在产业界兜兜转转几年后,颜水成再次选择回归学界——重返新加坡国立大学NUS,担任计算机系特聘教授。没错,就是他第一个教职所在地,也是他声名鹊起的地方。而距离他上一次动向,过去不到三个月。去年11月份,他突然卸任昆仑万维研究院院长。官方宣布,改任昆仑万维荣誉顾问,继续为公司在AI科研领域...

OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了

1 月 21 日
阅读 4 分钟
461
关注前沿科技 量子位没错,OpenAI的智能体时代真的要来了!据大名鼎鼎的“情报员”光头哥爆料,OpenAI在MAC版ChatGPT桌面应用中隐藏了启用/禁用智能体的选项。从截图来看,确实是传闻已久、代号为“Operator(操作员)”的辣个:而且这则爆料也得到了日常关注苹果方面消息的博主@M1的再次佐证:Operator正在内测中,即将上线...

日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速 | 大模型商用2024

1 月 20 日
阅读 5 分钟
496
原创 关注前沿科技 量子位如果2023年给大模型的关键词是席卷,那么在2024,这个关键词应该是渗透。最常用的软件、手机PC本身、甚至厨卫/电源开源,都在被AI重塑。主观感受中,这一年,AI更加强大,以前所未有的速度嵌入各行各业。真实的客观世界里,千行百业到底发生了哪些变化?变化之下,谁推动促成了这一切发生?全新...

o3数学成绩作弊大瓜!提前让测试机构给真题,60多名数学大牛全被蒙在鼓里

1 月 20 日
阅读 4 分钟
391
关注前沿科技 量子位OpenAI o3还没上线,就被曝数学成绩是靠作弊得来?!Benchmark发布机构内部人员爆料称,OpenAI给了他们经费赞助。就连包括陶哲轩在内参与出题的60余名数学家,在消息曝光之前也都和普通公众一样蒙在鼓里。直到o3发布,这一消息才被公开。这意味着严格保密的题目,OpenAI提前拿到了手中。这套数据集名...

o1推理框架最新成果:斯坦福&伯克利提出元链式思维,升级模型推理能力

1 月 20 日
阅读 5 分钟
510
关注前沿科技 量子位o1背后的推理原理,斯坦福和伯克利帮我们总结好了!在最新的一篇长达100页的论文中,他们将o1模型背后的推理机制提炼成了一个通用的框架——元链式思维(Meta-CoT)。这个元链式思维(Meta-CoT)到底是什么意思呢?简单来说,它可以让模型在推理过程中反思推理任务——这也是o1模型可以在HARP等数学基准...

微软开源Markdown工具爆了:支持Office文档,可接多模态LLM直出报告

1 月 20 日
阅读 7 分钟
841
它不仅可以将常见的Office文档(Word、PowerPoint、Excel)、PDF、图像、音频等转换为对大模型更友好的Markdown格式。

DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键

1 月 19 日
阅读 3 分钟
527
原创 关注前沿科技 量子位DeepSeek版o1,有消息了。还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI o1的中档推理设置相当。注意了,这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview(轻量预览版)。而是摘掉了轻量版的帽子,称为DeepSeek-R1-Preview(预览版),意味着替换了规模更...

多活十年!OpenAI为研究长寿推出GPT-4b,联手清华大牛丁胜搞“细胞重编程”,奥特曼本人投资

1 月 19 日
阅读 3 分钟
486
关注前沿科技 量子位OpenAI要研究人类长寿问题了??推出新模型GPT-4b micro。可以设计出将普通细胞转化为干细胞的蛋白质。据MIT科技评论消息,这是OpenAI首个专注于生物数据的大模型,也是OpenAI首次公开声称其模型可以带来意想不到的科学发现。研究合作方Retro Biosciences,一家成立于2022年的创业公司,专注于“抵抗...

北大数学校友胡懿娟归国任教!重回母校,专注于统计学、微生物学和遗传学的交叉领域

1 月 18 日
阅读 3 分钟
563
关注前沿科技 量子位又一科学家从美归国——北大数学系校友胡懿娟。援引人民日报消息,在北京大学北京国际数学研究中心发布的2024年工作回顾中显示,她于去年7月入职北大。回来之后,她将继续专注于统计学、微生物学和遗传学的交叉领域,致力于解决实际的生物医学数据分析问题。△北大官网截图网友纷纷为她点赞:能力与颜值...

Search版o1:推理过程会主动查资料,整体性能优于人类专家,清华人大出品

1 月 18 日
阅读 5 分钟
479
关注前沿科技 量子位一个新框架,让Qwen版o1成绩暴涨:在博士级别的科学问答、数学、代码能力的11项评测中,能力显著提升,拿下10个第一!这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」Search-o1的特别之处。项目团队成员发现,o1和o1类模型在推理过程中表现突出,但却存在“知识不足”的明显缺陷——推理...

扩散模型低位量化突破!有效扩散量化的极限推向2-4位,W2A4位宽下FID降低58%,超越SOTA方法

1 月 18 日
阅读 9 分钟
531
关注前沿科技 量子位降低扩散模型生成的计算成本,性能还保持在高水平!最新研究提出一种用于极低位差分量化的混合精度量化方法。 △图1 W2A6位宽下基线和MPQ-DM生成的样本可视化目前,扩散模型在生成任务中受到了广泛关注。然而,昂贵的计算成本阻碍了扩散模型在资源受限场景中的应用。量化是一种实用的解决方案,通过减...

国产3D生成大模型火爆外网!歪果仁年都不过了,都在测这个

1 月 17 日
阅读 4 分钟
520
关注前沿科技 量子位“3D大模型终于可以生成锐利的边角了!”“在钻研了一阵3D人工智能后,我总算通过Hyper3D.ai用上了Rodin1.5,它真的可能改变游戏规则。”2024年的最后一天,随着3D生成工具Rodin Gen-1.5的上线,在网络上掀起了新一波对于3D生成讨论的热潮。用Rodin背后的研发团队——影眸科技CTO张启煊的话说:这是3D大模...

首个国产版AlphaFold3发布!大分子预测精度超车,在线平台即开即用,推理成本更是白菜价

1 月 17 日
阅读 4 分钟
476
原创 关注前沿科技 量子位来了,国内首个对标AlphaFold3的产品——HelixFold3,来自百度智能云与百度螺旋桨团队。它在常规生物分子结构预测任务中实现了AlphaFold3媲美水平:尤其RNA分子和共价修饰场景中,精准度上持平或者实现了大幅超越。△图注,蓝色为HelixFold3,黄色为AlphaFold3还有抗原-抗体结构预测任务中,成功率...

OpenAI前CTO最隐秘AI创业:没名字没方向,挖走OpenAI高管,10位顶尖人才投奔

1 月 17 日
阅读 2 分钟
380
关注前沿科技 量子位公司名字没有,产品方向未定。OpenAI前CTO创业几个月,却已经有10位顶尖研究员和工程师投奔。且分别来自OpenAI、谷歌、Anthropic这几个巨头。其中包括OpenAI特别项目负责人Jonathan Lachman。随后,OpenAI发言人也证实了Lachman的离职。去年九月,Mira离开OpenAI被曝AGI创业,一个月后就吸金超1亿美...