ComfyUI Chroma 解锁文生图新维度;OpenMathReasoning 数学推理数据集,首个专注数学推理的高质量数据集

5 月 23 日
阅读 8 分钟
170
文生图模型近几年取得了显著进展,但现有模型在实际应用中仍有很多局限。大多数模型只能单一生成图片,无法对图片进行精细化调整。为了应对这一挑战,rock 团队推出了文生图模型 Chroma 。
封面图

谷歌发布 MedGemma,基于 Gemma 3 构建,专攻医学文本与图像理解

5 月 23 日
阅读 2 分钟
193
近两日,Google I/O 2025 热度正盛,公司 CEO Sundar Pichai 在活动首日的主题演讲中便分享了多项创新,例如 Gemini 2.5 的全系列升级,Agent Mode 上线 Chrome,编码智能体 Jules 开启公测,Android XR 正式版亮相等等。而在一众令人眼花缭乱的重磅更新之中,还隐藏着一个面向于医疗领域的重磅开源成果——MedGemma 。
封面图

Gemini 2.5 全系更新,Deep Think 加持碾压 OpenAI

5 月 22 日
阅读 2 分钟
178
北京时间 5 月 21 日凌晨,Google I/O 2025 大会如约而至,公司 CEO Sundar Pichai 在主题演讲中接连宣布多项重要更新,全面展示了 Google 在 AI 领域的强劲能力与增长速度。
封面图

融合蛋白质语言模型和图像修复模型,麻省理工与哈佛联手提出 PUPS ,实现单细胞级蛋白质定位

5 月 22 日
阅读 7 分钟
179
蛋白质亚细胞定位(subcellular localization of a protein)是指蛋白质在细胞结构中具体的定位情况,这对蛋白质行使其生物学功能至关重要。举个简单例子,如果把细胞想象成一个庞大的企业,其中细胞核、线粒体、细胞膜等对应总裁办、发电部、门岗等不同的部门,那么只有对应的蛋白进入正确的「部门」才能使其正常工作,...
封面图

浙大团队研发 Earth Explorer 系统,探索深时演化/地学剖面/科研场景,赋能深时地球科学研究

5 月 21 日
阅读 5 分钟
165
深时地球科学研究聚焦地球的漫长历史,探寻从数十亿年前到如今的地质演化过程,研究范畴广泛,涵盖了地球内部结构、物质组成、生命演化,以及地球与外部环境的相互作用等关键领域。近年来,地学可视化分析方法对多维时空交互分析的需求日益增加,大数据、人工智能、高分辨率成像等技术的迅猛发展为实现深时地球数字孪生...
封面图

【Triton 教程】triton_language.tensor

5 月 20 日
阅读 3 分钟
479
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →[链接]
封面图

在线教程|支持 19 种语言,生成速度快 15 倍!ACE-Step 音乐生成模型上线

5 月 20 日
阅读 4 分钟
164
当前的音乐生成模型在生成速度、音乐连贯性和可控性之间面临着固有的权衡。例如,基于 LLM 的模型(例如 Yue 、 SongGen)在歌词对齐方面表现出色,但推理速度慢且存在结构性伪影。另一方面,扩散模型(例如 DiffRhythm)虽然能够实现更快的合成速度,但通常缺乏长距离的结构连贯性。对此,人工智能公司阶跃星辰(StepFu...
封面图

【TVM 教程】创建使用 microTVM 的 MLPerfTiny 提交

5 月 19 日
阅读 8 分钟
547
本教程展示了如何使用 microTVM 构建 MLPerfTiny 提交。该教程演示了从 MLPerfTiny 基准模型中导入一个 TFLite 模型,使用 TVM 进行编译,并生成一个可以刷写到支持 Zephyr 的板上的 Zephyr 项目,以使用 EEMBC runner 对模型进行基准测试的步骤。
封面图

黄仁勋最新演讲!开放生态的 NVLink Fusion 支持半定制 AI 基础设施;开源人形机器人基础模型

5 月 19 日
阅读 3 分钟
163
英伟达 CEO 黄仁勋于北京时间 5 月 19 日上午 11 点,在 Computex 2025 上带来了主题演讲,重点介绍了公司在数据中心、企业级 AI 和机器人等领域的最新进展。在近 2 小时的分享中,「皮衣刀客」释放了多个重磅消息,例如:
封面图

基于 800 万真实数据,康奈尔大学团队利用图神经网络精准预测肺癌患者生存期,发现 3 类致命亚型

5 月 19 日
阅读 5 分钟
166
10 年前,CheckMate 017 试验成果曾震动肿瘤学界。「新英格兰医学杂志(The New England Journal of Medicine)」、「美国医学会杂志(The Journal of the American Medical Association)」等多次报道,接受 PD – 1 抑制剂 Nivolumab 治疗的晚期肺鳞癌患者,生存数据显著提升:中位总生存期从化疗 6 个月升至 9.2 个月...

10 大医学数据集汇总:覆盖问答/推理/真实临床记录/超声图像/CT 影像……

5 月 16 日
阅读 3 分钟
812
随着人工智能技术在医疗领域的深度融合与医学影像技术的持续革新,作为解锁生命奥秘的关键钥匙,医学数据正以爆发式的速度累积增长。它突破了传统医学研究的边界,为疾病诊疗与健康管理带来了革命性的变革。
封面图

谷歌 DeepMind 发布 AlphaEvolve,解决 300 年数学难题,为近 40 个数学问题找到更优解决方案

5 月 15 日
阅读 2 分钟
785
北京时间 5 月 14 日深夜,谷歌 DeepMind 重磅发布了一款名为 AlphaEvolve 的编程 AI Agent,其将大语言模型的强大代码生成能力与自动评估(automated evaluators)相结合,能够针对数学和现代计算中的一些基础性和复杂问题进行算法的设计与优化。
封面图

首次实现纳米晶体端到端解析,哥大团队提出 PXRDnet,成功解析 200 种复杂模拟纳米晶体

5 月 15 日
阅读 6 分钟
749
X 射线衍射(X-ray diffraction, XRD)的发现和应用堪称晶体学发展中的一个重要里程碑,因为该技术使得人们能够深入了解晶体的微观结构,继而带动了材料学和整个人类文明的进步。然而,当传统的方法与由微小颗粒组成的粉末状纳米晶体不期而遇时,理想的结果却并未发生。
封面图

【vLLM 学习】基础教程

5 月 14 日
阅读 12 分钟
901
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →[链接]在线运行 vLLM 入门教程:零基础分步指南源码 examples/offline_inference/basicBasicLLM 类提供了主要的 Python 接口,用于离线推理,即在不使用独立推理服务器的情况下...
封面图

在线教程丨 9 秒处理一张图!In-Context Edit 高效图像编辑框架上线

5 月 14 日
阅读 2 分钟
813
现有的图像编辑方法主要面临精度与效率之间难以平衡的问题。微调方法需要大量的计算资源和优质数据集,而无需训练的技术则难以满足指令理解和编辑质量。对此,浙江大学和哈佛大学的研究团队推出了 In-Context Edit(ICEdit),一款基于指令的图像编辑框架,仅需极少的文本指令即可实现精准的图像修改,为图像处理和内容...
封面图

【Triton 教程】triton.Config

5 月 13 日
阅读 1 分钟
850
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →[链接]
封面图

David Baker 团队最新研究,利用蛋白质序列生成模型实现重叠基因设计,成功率极高

5 月 13 日
阅读 5 分钟
968
1977 年,英国生物化学家弗雷德里克·桑格(Frederick Sanger)在解析 ΦX174 噬菌体基因组时,首次发现了一个颠覆认知的现象:这个仅 5.4kb 的 DNA 分子编码的蛋白质总长度,远超其物理容量限制。测序结果揭示,两对基因通过不同阅读框架共享同一 DNA 区域——这种被称为重叠基因(OLG)的现象,在病毒世界中极为普遍。例如...
封面图

登Nature子刊,俄罗斯研究团队基于机器学习实现万亿级质谱数据搜索,发现未知化学反应

5 月 12 日
阅读 6 分钟
931
质谱分析(Mass Spectrometry, MS)是现代化学研究的核心技术之一。通过测量分子离子的质荷比(m/z),质谱能够提供化合物的分子式、 结构 甚至反应机理的关键信息。高分辨率质谱(High-Resolution Mass Spectrometry, HRMS)的出现,更是将分析精度提升至百万分之一(ppm)级别,成为有机合成、金属催化、药物开发等领...
封面图

登 Nature 子刊,俄罗斯研究团队基于机器学习实现万亿级质谱数据搜索,发现未知化学反应

5 月 12 日
阅读 6 分钟
1k
质谱分析(Mass Spectrometry, MS)是现代化学研究的核心技术之一。通过测量分子离子的质荷比(m/z),质谱能够提供化合物的分子式、结构甚至反应机理的关键信息。高分辨率质谱(High-Resolution Mass Spectrometry, HRMS)的出现,更是将分析精度提升至百万分之一(ppm)级别,成为有机合成、金属催化、药物开发等领域...
封面图

vLLM 实战教程汇总,从环境配置到大模型部署,中文文档追踪重磅更新

5 月 9 日
阅读 4 分钟
1.1k
随着大语言模型(LLM)逐步走向工程化与规模化部署,其推理效率、资源利用率以及硬件适配能力正成为影响应用落地的核心问题。2023 年,加州大学伯克利分校的研究团队开源 vLLM,通过引入 PagedAttention 机制对 KV 缓存进行高效管理,显著提升模型吞吐量与响应速度,在开源社区迅速走红。截至目前,vLLM 在 GitHub 上已...
封面图

【Triton 教程】triton.heuristics

5 月 9 日
阅读 1 分钟
1.1k
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
封面图

vLLM 实战教程汇总,从环境配置到大模型部署,中文文档追踪重磅更新

5 月 9 日
阅读 4 分钟
1.6k
随着大语言模型(LLM)逐步走向工程化与规模化部署,其推理效率、资源利用率以及硬件适配能力正成为影响应用落地的核心问题。 2023 年,加州大学伯克利分校的研究团队开源 vLLM,通过引入 PagedAttention 机制对 KV 缓存进行高效管理,显著提升模型吞吐量与响应速度,在开源社区迅速走红。截至目前,vLLM 在 GitHub 上已...
封面图

性能远超 SAM 系模型,苏黎世大学等开发通用 3D 血管分割基础模型,入选 CVPR 2025

5 月 9 日
阅读 6 分钟
1k
如果把人的身体比作一座庞大的城市,那么血管无疑就是这座城市的「道路」,动脉、静脉以及毛细血管对应着高速公路、城市道路以及乡间小道,它们相互协作,通过血液将营养物质、氧气等输送到身体各处,从而维持着这座「城市」的高效、稳定运行。而当这些道路出现问题时,人们的身体自然也会随之发生病变。
封面图

性能远超SAM系模型,苏黎世大学等开发通用3D血管分割基础模型

5 月 8 日
阅读 6 分钟
1.1k
如果把人的身体比作一座庞大的城市,那么血管无疑就是这座城市的「道路」,动脉、静脉以及毛细血管对应着高速公路、城市道路以及乡间小道,它们相互协作,通过血液将营养物质、氧气等输送到身体各处,从而维持着这座「城市」的高效、稳定运行。而当这些道路出现问题时,人们的身体自然也会随之发生病变。
封面图

【TVM 教程】使用 TVMC Micro 执行微模型

5 月 8 日
阅读 4 分钟
973
本教程介绍了如何为微型设备编译一个微模型,并在 Zephyr 平台上构建一个程序,来执行这个模型,烧录程序,并用 tvmc micro 命令来执行所有模型。在进行本教程之前你需要安装 python 和 Zephyr 依赖
封面图

中日团队联合攻关,利用大模型解析氢化物固态电解质传导机制,建立可靠活化能预测模型

5 月 7 日
阅读 5 分钟
1.3k
随着电动汽车和电子设备等行业的迅猛发展,高性能电池需求呈现出井喷式增长。作为下一代储能技术的核心,固态电池凭借更高的安全性、能量密度和循环稳定性,已成为全球科研竞争的焦点。固态电解质 (SSEs) 作为全固态电池 (ASSBs) 的关键组件,其性能参数直接决定着电池的输出效能与使用寿命,成为科研团队竞相攻克的技术...
封面图

入选 CVPR 2025,哈工大团队提出分层蒸馏多示例学习框架 HDMIL,快速处理千兆像素病理全切片图像

5 月 6 日
阅读 6 分钟
1.4k
病理图像包含了丰富的表型信息,依据病理图像进行病理诊断被广泛视为癌症诊断的「黄金标准」。其中,全视野切片图像 (Whole Slide Image, WSI) 是一种高分辨率的数字病理图像,利用全切片数字扫描技术将病理组织切片转换为高达 10 亿像素级别的数字图像,具有高分辨率、全景展示、数据量大等特点,是当前医学诊断、医学...
封面图

在线教程丨 Qwen3 狂揽近 20k star,网友实测:比 Llama 更快解决更难问题

4 月 30 日
阅读 3 分钟
1.5k
4 月 29 日凌晨,Qwen3 模型「家族」终于正式亮相,共 8 款混合推理模型全部开源,仅仅一天的时间便在 GitHub 斩获近 20k stars,而除了极高的讨论热度外,Qwen3 更是凭借性能的提升与部署成本的下探,一举问鼎开源大模型王座。
封面图

入选 ICLR 2025 Oral,清华 AIR 周浩团队提出蛋白质预训练新范式,解密蛋白质家族进化

4 月 29 日
阅读 5 分钟
1.1k
清华大学 AIR GenSI 研究组联合清华大学药学院共同提出了一种用于蛋白质家族特异性生成建模的工具——ProfileBFN(即轮廓贝叶斯流网络)。 ProfileBFN 能够从多序列比对 (MSA) 轮廓的角度扩展了离散贝叶斯流网络,实现了高效的蛋白质家族设计。实证结果表明,在生成多样且新颖的家族蛋白质时,ProfileBFN 能够准确捕捉家族...
封面图

开发迄今最大的遥感指令数据集,IBM 研究院等提出专为地球观测数据设计的 VLM,入选 CVPR 2025

4 月 28 日
阅读 5 分钟
1.3k
地球观测领域正经历着一场变革性的发展浪潮,其重要性与日俱增。从产业规模看,2024 年 5 月世界经济论坛报告显示,其潜在经济价值将从 2023 年的 2,660 亿美元攀升至 2030 年的超 7,000 亿美元。多国及国际组织早已重视地球观测的战略意义并积极布局。
封面图