以不足 10 万结构数据训练,瑞士洛桑联邦理工学院提出 PET-MAD,原子模拟精度媲美专业模型

12 月 15 日
阅读 6 分钟
101
从半导体材料到药物活性分子,电子结构始终是理解性能的关键。第一性原理计算依托量子力学,可准确预测物质的结构、稳定性和功能,曾推动材料设计与药物研发的快速进展。但其计算量随体系规模急剧增加,即便是顶级超级计算机,也难以对蛋白质折叠、催化反应等复杂过程进行长时间尺度的模拟,造成「能表述机制,却难以算...
封面图

CPU 免费用/30 小时 GPU 额度/70GB 超大存储,HyperAI Pro 正式上线!

11 月 26 日
阅读 1 分钟
1k
目前,HyperAI 超神经已经为大家精选了数百个机器学习相关教程,并整理成 Jupyter Notebook 的形式,无论是初学者,亦或经验丰富的工程师,都能够便捷地体验优质开源项目,或是创建全新的模型部署。 HyperAI 超神经用稳定的算力助力 AI 项目从灵感迸发到快速落地。
封面图

百度出招!OCR 模型 PaddleOCR-VL 打破管道与端到端方法局限;面部情感识别数据集 Facial Emotion Recognition,赋能 AI 读懂表情

11 月 25 日
阅读 6 分钟
1.1k
现今文档内容的复杂性对解析技术提出了更多挑战:它们往往融合了长篇幅文本、复杂图表、专业公式、多语言等各种要素,并可能具有不规则的版面结构,因此高效、精准的文档解析已成为不可或缺的关键技术。
封面图

美团开源视频生成模型 LongCat-Video,兼具文生视频/图生视频/视频续写三大能力,媲美开闭源顶尖模型

11 月 25 日
阅读 3 分钟
1k
世界模型旨在理解、模拟与预测复杂的现实世界环境,是人工智能在真实场景中实现有效应用的重要基础。在这一框架中,视频生成模型通过其生成过程,逐步压缩并学习几何、语义、物理等多种知识形态,因而被视为构建世界模型的一条关键路径,并有望最终实现对真实物理世界动态的有效模拟与预测。而在视频生成领域,实现高效...
封面图

AI 论文周报丨 Attention 机制/英伟达 VLA 模型/TTS 模型/图神经网络……一文了解 AI 最新进展

11 月 25 日
阅读 3 分钟
228
视觉语言模型(VLMs)与视觉语言架构(VLAs)已在自动驾驶领域得到广泛应用。然而,现有方法大多存在明显局限:或是缺乏显式的推理机制,或是以自由、非结构化的方式进行推理,导致模型难以泛化到训练数据分布之外。
封面图

活动回顾丨 北京大学/清华大学/Zilliz/MoonBit 共话开源,覆盖视频生成/视觉理解/向量数据库/AI 原生编程语言

11 月 25 日
阅读 4 分钟
231
当下,AI 产业正迎来一个前所未有的发展周期。大模型的规模化应用、 AI 原生软件体系的重构、多模态基础模型的加速演进,让学界与产业界的边界变得愈发模糊。无论是视频生成对音画同步的精细化要求、终端侧视觉模型的高效推理优化,还是新一代 AI 原生编程语言的出现,都在推动一个清晰的趋势——产研协同与开源生态,正在...
封面图

卡内基跨学科团队利用随机森林模型,基于 406 份样本成功捕捉 33 亿年前生命遗迹

11 月 24 日
阅读 6 分钟
271
解码深埋于地表之下的古老岩层里的有机分子,对于掌握地球历史与研究生命演进具有至关重要的作用。这些生命活动的潜在见证者不仅能够破解地球生命诞生的谜题,尤其是厘清光合作用的起源和地球大气氧化进程的关联,还能填补生命演进时间线的空白,为理解早期地球生态系统的形成提供核心线索。然而,由于这些「见证者」不...
封面图

在线教程丨 30 毫秒处理 100 个检测对象,SAM 3 实现可提示概念分割,性能提升 2 倍

11 月 24 日
阅读 3 分钟
386
在视觉场景中识别并分割任意物体的能力,是多模态人工智能的重要基础,可广泛应用于机器人、内容创作、增强现实、数据标注等领域。 SAM(Segment Anything Model)是 Meta 于 2023 年 4 月发布的人工智能通用模型,提出了针对图像和视频的可提示分割任务,主要支持基于点、框或掩码的提示来分割单个目标。
封面图

200 亿美元豪赌!xAI 单押马斯克巨注叫板 OpenAI,未来商业续航成最大问号

11 月 24 日
阅读 7 分钟
441
2025 年 10 月,多家媒体援引投行消息称,马斯克旗下的 xAI 正在推进一笔规模约 200 亿美元的新融资,或将跻身全球融资规模最大的 AI 初创公司之一。知情人士透露,该轮融资包含约 125 亿美元的结构化债务,并与 NVIDIA 产品采购协议绑定,意味着 xAI 将以未来算力交付与长期供货为抵押,锁定芯片的获取优先级。
封面图

10 亿用户目标仅达 2%,Sam Altman 押注的人类身份验证基础设施遭遇全球监管困局

11 月 24 日
阅读 4 分钟
602
Sam Altman 与 Alex Blania 在创立 Tools for Humanity 时,怀揣着一个宏大的使命:在 AI 真假难辨的时代,为人类建立一个可靠的数字身份基石。然而,这条保障「人类中心地位」的朝圣之路,正因其独特的运作方式,在全球范围内遭遇监管的铜墙铁壁。
封面图

斯坦福/北大/UCL/UC 伯克利联手,利用 CNN 从 81 万类星体中精准识别 7 个罕见透镜样本

11 月 24 日
阅读 6 分钟
561
爱因斯坦在 1915 年提出的广义相对论石破天惊地指出,质量不仅能产生引力,还会弯曲其周围的时空,光线和物质的运动都遵循着弯曲的时空路径。因此,大质量天体就像一个天然的透镜,能够使附近经过的光线发生偏折。
封面图

输入输出双侧革新!腾讯混元推出 HunyuanWorld-Mirror 刷新 3D 重建 SOTA; 解码 Netflix 内容全貌!Netflix 电影电视目录数据集助力洞察娱乐趋势

11 月 24 日
阅读 7 分钟
1.3k
视觉几何学习是计算机视觉领域的核心课题,广泛应用于增强现实、机器人操控与自主导航等场景。传统方法如运动结构重建(SfM)与多视图立体技术通常依赖迭代优化,计算代价高昂。近年来,该领域逐渐转向基于前馈神经网络的端到端几何重建模型。
封面图

重塑无序蛋白集合预测能力,英伟达/MIT/牛津大学/哥本哈根大学/Peptone 等发布生成式模型及新评测基准

11 月 24 日
阅读 6 分钟
681
在结构生物学的发展历史中,「结构决定功能」一度被视为近乎不可动摇的基本法则。无论是胰岛素的经典螺旋构象,还是血红蛋白的四聚体架构,都强化了一个共识:蛋白质要发挥生物学作用,必须拥有稳定的三维结构。
封面图

AI 论文周报丨从头蛋白质设计/首个开源 Agent 方案/HunyuanOCR/Olmo 3 语言模型……一键速览

11 月 24 日
阅读 3 分钟
847
多模态大语言模型(MLLM)在实现类人交互方面潜力巨大,但其发展正面临一个关键挑战:缺乏一个面向以人为中心场景的细粒度评估框架,该框架需能同时衡量模型对复杂人类意图的理解能力和提供富有同情心、上下文感知反馈的能力。
封面图

NeurIPS 2025 最佳论文奖公布!Qwen 团队/清华大学/斯坦福等联合研究成果入选

11 月 24 日
阅读 5 分钟
961
NeurIPS 2025 的最佳论文奖和亚军论文奖授予了 7 篇具有突破性的论文,包括 4 篇最佳论文(其中一篇来自数据集和基准测试领域)和 3 篇亚军论文。
封面图

首个天文多模态基础模型 AION-1 诞生!加利福尼亚大学伯克利分校等基于 2 亿天文目标预训练,成功构建泛化性多模态天文 AI 框架

11 月 24 日
阅读 6 分钟
1.1k
基于 Transformer 架构的基础模型,已在自然语言处理与计算机视觉等领域引发深刻变革,推动技术从「一事一模型」的定制范式,迈向通用化的新阶段。然而,当这类模型进入科学研究领域时,却遭遇了明显的水土不服。科学观测数据来源多样、格式不一,且常包含各类观测噪声,使得数据呈现出显著的「复杂异质性」。这一现实使...
封面图

靠并购起家,72 岁的博通 CEO 续约至 2030 年,欲将公司 AI 业务收入提至 1200 亿美元

11 月 24 日
阅读 6 分钟
786
2017 年 11 月初,在特朗普的上一个任期内,白宫迎来了一位与众不同的 CEO——不似强调技术愿景的科技新贵、区别于逐利风口的华尔街投资人,鲜少出现在聚光灯下的 Broadcom(博通)CEO Hock Tan 彼时年逾花甲,站在特朗普身前高调宣布将把公司总部从新加坡迁到美国,落脚硅谷。
封面图

剑桥大学研发血液细胞图像分类器,扩散模型助力白血病发现,能力超越临床专家

11 月 24 日
阅读 6 分钟
897
血液细胞影像分析在临床诊断和科研中扮演着至关重要的角色。白细胞、红细胞和血小板的形态特征不仅能反映血液系统健康状况,还可能揭示早期疾病信号,如白血病和骨髓增生异常综合征等。然而,传统人工显微镜分析依赖经验丰富的专家进行手动分类,效率低下、耗时且存在主观偏差。
封面图

AI 论文周报丨通用 Agent 开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

11 月 21 日
阅读 3 分钟
1.1k
近年来,大语言模型(LLMs)的发展已将研究前沿从解谜任务推进至科学级推理——即能够应对那些答案必须经受自然规律检验、而不仅符合评分标准的复杂问题。物理学是衡量这一转变的最严苛标准,因为它以根本性方式将符号系统与现实世界相联结,是现代大多数技术的基石。
封面图

从干洗店到伊丽莎白女王工程奖,李飞飞逆行硅谷技术神话,聚焦 AI 去人性化风险

11 月 21 日
阅读 6 分钟
1.2k
2025 年春,普林斯顿大学物理学学士、加州理工学院计算神经科学博士李飞飞教授荣获「伊丽莎白女王工程奖(Queen Elizabeth Prize for Engineering)」,这一奖项被视为「工程领域的诺贝尔奖」。评审团表彰了李飞飞在计算机视觉与深度学习中的奠基性工作,认为她的研究「让机器第一次以接近人类的方式看见世界」。
封面图

从 9,874 篇文献到 1.5 万晶体结构,MOF-ChemUnity 重构 MOF 全景知识,推动材料发现进入「可解释 AI」时代

11 月 20 日
阅读 6 分钟
1.2k
在材料科学领域,金属有机框架(Metal–Organic Frameworks,MOFs)堪称科学家们的「瑞士军刀」:它们具有高比表面积、化学可调性和结构多样性,在气体分离与储存、催化以及传感等领域具有广泛应用。然而,对于科研人员而言,MOF 的世界极其庞大且复杂——目前已有超过 12.5 万种 MOF 框架被合成,并计算预测了数百万种可能...
封面图

图像地理定位新突破!缅因大学/谷歌/OpenAI 等提出 LocDiff 框架,实现无需网格与参考库的全球级精准定位

11 月 19 日
阅读 6 分钟
1.2k
位置解码技术通过从上下文信息中推断地理位置,广泛应用于轨迹合成、建筑物轮廓分割和图像地理定位等领域。其中,图像地理定位将视觉内容与地理坐标关联,成为研究重点。它通过分析图像特征预测经纬度坐标,适用于野生动物监测、城市街景等数据类型。
封面图

在线教程丨目标检测迈入「全局感知」时代:清华大学等发布 YOLOv13,实现速度、精度双突破

11 月 18 日
阅读 3 分钟
1.4k
在自动驾驶、工业质检、安防监控等需要「毫秒级反应」的应用场景中,实时目标检测始终是一条极具挑战的技术赛道。过去十年里,YOLO 系列凭借轻量高效的架构成为该领域的主流方案,从最初的 YOLO 到近年的 YOLOv11 、 YOLOv12,模型不断在速度与精度之间寻找新的平衡点。
封面图

跨学科创新远超人类?AI 科学家提假设/做实验/发顶会开启科学研究新范式

11 月 17 日
阅读 6 分钟
1.3k
2024 年 8 月,由 Transformer 论文作者之一 Llion Jones 创立的 Sakana AI 公司宣布推出全球首位「AI 科学家(AI Scientist)」,通过自主生成研究想法、设计实验、编写代码、执行实验乃至撰写论文,并借助「AI 审稿人」对结果进行评审与改进,形成了完整闭环的科研生态系统。今年 3 月,该系统产出的一篇计算机科学论...
封面图

合成生物学之父/OpenAI 前高管/Flagship 合伙人,Lila Sciences 估值达 13 亿美元,目标推进「科学超级智能」

11 月 14 日
阅读 4 分钟
1.4k
位于美国马萨诸塞州剑桥的初创公司 Lila Sciences ,近期宣布完成了 3.5 亿美元的 A 轮融资,总额资额达到 5.5 亿美元,使公司估值突破 13 亿美元,正式跻身独角兽行列。投资方阵容也颇具分量——英伟达、 Flagship Pioneering 、 ARK Venture Fund 、阿布扎比投资局(ADIA)等知名机构集体下注。
封面图

NeurIPS2025 丨 MIT 提出自动化科学发现工具,AutoSciDACT 对天文/物理/生物医学等异常数据强敏感

11 月 13 日
阅读 6 分钟
1.4k
古往今来,科学发现常带有几分偶然性,例如青霉素从发霉的培养皿中意外诞生,宇宙微波背景辐射源于天线捕捉到的「异常噪声」,这些不经意的观察结果,最终都成为推动人类文明进步的关键驱动力。如今,在「数据密集型」的科研环境中,海量跨领域数据中藏着更多奇特且难以解释的观察结果,理论上让偶然科学发现的契机实现...
封面图

Stability AI 正式启动商业化转型:开源繁荣但盈利危机,高层换血/产品重构能否自救

11 月 12 日
阅读 6 分钟
1.6k
2025 年 8 月 5 日,Stability AI 发布面向企业的产品「Stability AI Solutions」,首席执行官 Prem Akkaraju 在官方声明中表示,该产品旨在为企业创意制作提供生成式 AI 解决方案,「企业需要的不仅仅是一个平台,而是一个合作伙伴,这正是 Stability AI Solutions 所提供的。」这次发布被视为 Stability AI 从开放社区...
封面图

在线教程丨 Deepseek-OCR 以极少视觉 token 数在端到端模型中实现 SOTA

11 月 11 日
阅读 3 分钟
1.3k
众所周知,大语言模型在处理千字、万字或是更长文本时,计算量往往急剧增加,甚至直接导致算力的「烧钱」游戏,也因此制约了 LLM 在处理高密度文本信息场景中的效率边界。
封面图

实时目标检测 SOTA!YOLOv13 拓展全局感知能力;入选 NeurIPS 2025,UltraHR-100K 解锁超高分辨率文生图

11 月 10 日
阅读 6 分钟
1.3k
实时目标检测长期以来是计算机视觉领域的前沿研究方向。从工业检测到自动驾驶,科研界与工业界对「速度」与「精准」的追求从未停歇。而在这一领域,YOLO 系列模型凭借其推理速度和准确性的出色平衡而占据主流地位。
封面图

哥伦比亚大学/斯坦福联手!Squidiff 实现多场景转录组模拟,助力精准医学与空间医学发展

11 月 10 日
阅读 6 分钟
1.1k
在细胞生物学研究中,活细胞始终是远离化学平衡的复杂耗散系统,其群体如何协同响应外界刺激,始终是科学家致力揭示的核心科学问题。这种响应不仅受组织内部异质性及外部信号的共同调控,更常表现出难以预测的非线性动态特征。尽管单细胞测序技术已能让我们无偏解析细胞的异质性构成,但要精准追溯细胞受刺激后整个转录...
封面图