清华大学刘洋老师组、人民大学高瓴人工智能学院黄文炳老师组、字节跳动 AI 制药团队共同提出了一种跨分子种类统一生成框架 UniMoMo 。该框架基于分子片段(block)对不同种类的分子进行统一表示,使用变分自编码器对每个 block 的全原子构象进行压缩,并在压缩后的隐空间进行几何扩散建模(diffusion),从而实现对同一靶点不同结合分子种类(小分子、多肽、抗体)的设计。 UniMoMo 在多类分子任务基准的评测中均实现领先表现,展示了跨模态知识迁移与数据共享的巨大潜力。
相关成果以「UniMoMo: Unified Generative Modeling of 3D Molecules for De Novo Binder Design」为题,入选 ICML 2025 。
论文地址:
开源项目地址:
https://github.com/kxz18/UniMoMo
为什么需要统一建模
不同的分子类型在药物开发中各有优劣,因此在不同的疾病场景中往往需要选择最合适的分子类型。例如:
* 小分子体积小、易于口服、穿透性强,适合进入细胞内部作用于靶点,广泛应用于慢性病和代谢类疾病等;
* 多肽类分子拥有较高的靶向性,能够与蛋白质表面的大而平的区域结合,适合靶向「难成药」的蛋白互作位点,常用于癌症、炎症等治疗中;
* 抗体具有极高的选择性和亲和力,能够稳定识别特定的蛋白标志物,特别适合免疫治疗等精确干预场景。
因此,面对不同的疾病机制、靶点特征和用药需求,适合使用的分子类型是不同的。现有的生成方法通常只针对某一类分子(如小分子、肽或抗体)进行建模,既无法满足多样化的治疗需求,也无法利用不同分子之间的共性来提升模型性能。
从应用角度来看,统一建模可以让我们针对同一个靶点同时探索多种类型的候选药物,为不同的下游场景提供更多选择。
从机器学习角度出发,不同分子类型之间共享相似的结合规律(氢键、π-π 堆叠、盐桥等)和几何约束(键长、键角等),是可以相互借鉴的,因此统一建模通过利用更大的数据规模,应当能提升模型的泛化能力和交叉迁移能力。
UniMoMo 为同一结合位点设计不同种类的结合分子
生成式统一建模的困难
尽管统一生成不同类型分子的想法令人期待,但要实现这样一个框架仍面临巨大挑战,主要体现在分子表示的选择,以及生成算法的设计上。
首先,不同分子类型在结构表示上存在较大差异:小分子由各种官能团组成,结构高度多样且非线性;而肽和抗体则由氨基酸以线性序列连接构成,尤其抗体还具有功能明确的功能区域划分。一种直观但效果不佳的做法是将所有分子都视为原子图来建模。然而这种方式忽略了分子天然的层次结构,比如苯环或标准氨基酸等关键子结构,并且导致在处理如抗体这类结合面较大的体系时计算成本极高。
反之,如果仅使用常见的结构片段词表构建立片段级别的图(例如多数蛋白质设计的工作,只考虑 Cα 坐标),而忽略原子级细节,则会牺牲分子生成的可迁移性与精度,因为结合分子设计的本质规律是与靶点的空间相互作用,以及分子内部的几何约束,这些都是定义在原子级别上的物理规律,需要精确的全原子信息支持。
因此,要构建一个真正有效且高效的统一分子表示,就必须同时解决两个难题:既要保留原子层面的几何细节,又要抽象出结构上的层级先验。
其次,如果在生成中引入结构片段来保留层级先验,则对生成算法带来核心挑战:传统的扩散模型通常依赖于定长、固定结构的数据表示,例如固定数量的点云或原子。对于 AF3 一类的结构预测模型而言,由于 2D 拓扑是提前给定的,扩散过程中并不会产生原子数或 2D 结构的变化。而对于分子生成的任务,2D 拓扑和 3D 结构是需要被同时生成的,而当去噪过程中结构片段的类型发生变化时,其所对应的原子数量、种类和排布都会随之改变。这一点打破了常规扩散模型的假设,对建模提出了极高要求。
UniMoMo:统一的生成模型
为了解决不同分子类型结构差异大、建模难度高的问题,文章提出了一个全新的框架——UniMoMo,它从两个关键设计入手,有效兼顾了结构的层次性和原子级精度:
* 统一表示:以 block 形式建模所有分子类型。
无论是小分子、肽还是抗体,UniMoMo 都将其结构表示为由分子片段(block)组成的图。其中每个 block 可以是一个标准氨基酸,也可以是一个常见的小分子片段(如苯环、吲哚等)。在文章的实现中,记录的分子片段包括所有标准氨基酸和由主子图(principle subgraph)挖掘算法自动识别而得的小分子片段。所有的非天然氨基酸可以当作小分子进行分词。这种表示方式既同时保留了分子的原子级别细节,以及不同种类分子自身的层级结构,使统一建模成为可能。
* 全原子几何隐空间扩散模型:在压缩表示上进行高效生成。
为了解决生成过程中 block 种类改变导致的原子种类和数量同步改变的问题,并且为了提升生成效率和结构精度,文章设计了一个全原子的迭代变分自编码器(IterVAE),将每个 block 中的所有原子压缩为隐空间中的一个「点」,包括定长的隐空间表示向量和对应的隐空间坐标。
然后,模型在这个压缩的几何隐空间中进行生成式建模,生成新分子的潜在表示,最后再解码回完整的原子结构。由于隐空间的数据表示是定长(预先给定 block 的数量)且连续的,因此可以很容易地兼容已有的各种生成算法。在目前的尝试中,扩散模型(diffusion)已经能产生比较不错的结果。这种设计使得模型在生成过程中聚焦于 block 之间的全局布局,而细致的原子级构造则由解码器来补全,从而同时实现了高效性与原子级准确性的统一。
不同分子种类的分词方案以及模型整体架构
统一建模超越单域建模
为了验证 UniMoMo 在不同分子类型上的通用性与有效性,作者在多个基于结构设计任务中进行了系统评估,涵盖了小分子、多肽和抗体三类代表性的结合分子。通过与对应领域内最具代表性的单分子类型生成模型进行对比,实验旨在探讨统一建模是否具备更强的几何建模能力与跨模态泛化能力,特别是在空间结构合理性与结合能力等关键指标上的表现。
结果显示,统一训练的 UniMoMo 在所有分子类型上都实现了全面超越,不仅在结构还原精度上表现优异,更在关键的几何合理性和与靶点的相互作用质量上取得显著提升。
与靶点结合的多肽设计结果
在多肽生成任务中,UniMoMo 在多个关键指标上显著优于现有的专域模型,包括 RFDiffusion 、 PepFlow 和 PepGLAD 等。尤其在结构准确性方面,UniMoMo 达到了更低的复合物 RMSD 和单体的 RMSD,表明其生成的肽结构更加接近真实结合构象。
UniMoMo 还能生成具有更低 Rosetta 结合能的结构,反映出其对蛋白结合位点几何特征的更强建模能力。此外,在衡量多肽构象质量的二面角度分布一致性(JSD of backbone/sidechain torsions)以及原子级空间冲突(clash rate)等几何合理性指标上,UniMoMo 同样展现出领先表现。并且,使用所有数据训练的 UniMoMo(all)在各种指标上一致性地超过了仅使用多肽数据训练的模型,证明了 UniMoMo 的跨分子种类学习和泛化的能力。
抗体 CDR-H3 的设计结果
抗体 CDR-H3 的设计的合理性结果
在抗体设计任务中,UniMoMo 同样展现出强劲性能。相比现有方法如 MEAN 、 dyMEAN 和 DiffAb,UniMoMo 在召回天然结合的序列和结构(AAR 和 RMSD)以及结合能提升(IMP)等关键指标上均实现全面超越。特别是在多次采样生成的评估中,UniMoMo 能够以更高概率生成接近天然构象的抗体片段,显示出其在抗体结构空间中的良好探索能力。
同样的,使用跨分子类型数据联合训练的 UniMoMo(all)在所有指标上均优于仅使用抗体数据训练的版本,说明统一建模确实有助于模型学习到更普适、更可迁移的分子结构空间规律。这一结果凸显了不同分子类型之间在结构建模上的共性,也验证了跨域数据融合对提升生成质量的显著价值。
小分子设计的整体比较
小分子设计的子结构分析
在小分子生成任务中,UniMoMo 同样展现了优越的性能。通过在 CrossDocked2020 数据集上的评估,作者发现 UniMoMo 在基于 CBGBench 的综合评价上超越了现有主流方法。
具体而言,UniMoMo 在子结构分布(原子种类、官能团等)、化学性质合理性(QED 、 LogP 、 SA 等)、几何结构质量(键长/角度分布与原子冲突率等)以及相互作用得分(Vina docking)等方面均取得了更高的综合评分(完整的实验结果请查看原文)。尤为重要的是,与仅在小分子数据上训练的单域版本相比,跨分子类型训练的 UniMoMo(all)在所有评估维度上均有显著提升。这表明,即便是在分子结构构成最为灵活、类型最为多样的小分子场景中,统一模型依然能够从其他分子类型中迁移几何规律与相互作用模式,进而提升小分子的单体构象和相对口袋空间布局的合理性。这一现象再次验证了 UniMoMo 的核心理念:不同分子之间的几何约束和结合机制具有可共享的模式,统一建模可以有效激发这一潜力。
综合三类任务的实验结果,UniMoMo 展现出高度一致的优势:使用跨分子种类数据训练的统一模型在各自任务中优于现有的单域生成模型,且相比只用单域数据训练的 UniMoMo 有明显的能力提升。这一现象表明,分子设计中看似截然不同的任务,其底层的物理化学约束与空间几何规律实则具有高度共性,而 UniMoMo 的统一建模策略正好捕捉并放大了这种共性,从而实现跨任务迁移、互补增强。这些结果不仅验证了 UniMoMo 的有效性,也为未来构建更强大的统一的分子生成系统提供了强有力的实证支持。
GPCR 案例研究
UniMoMo 在 GPCR 相同结合位点设计的不同结合分子
作为案例,作者选取了人类最重要的药物靶标之一——G 蛋白偶联受体(GPCR),评估 UniMoMo 在同一结合位点上生成不同类型分子(多肽、抗体、小分子)的能力。 UniMoMo 所生成的多肽、抗体和小分子常用结合能评价的力场(Rosetta ΔG,Vina score)下均展现出不错的分布。而更令人惊喜的是,生成的小分子结构中还自发地模拟出类似天然氨基酸侧链的官能团,用于构建氢键,与靶点形成关键互作。此外,小分子还借鉴了多肽与抗体中的局部几何构型,如分子骨架上的酰胺连接,使其能够有效填充原本更适合大分子的结合口袋。这一案例生动展示了 UniMoMo 在实际任务中跨模态借鉴、自动适应结合口袋的能力,体现了其在三维结构层面深度理解靶点与分子之间相互作用,以及分子内部几何约束的潜力。
未来的探索
尽管 UniMoMo 已在多个分子类型与任务中展现出强大的统一生成能力,但作者也指出,该方向仍存在诸多值得探索的未来可能。
当前工作主要聚焦于天然氨基酸与常见分子片段的建模,后续可进一步扩展到非天然氨基酸、后修饰多肽/抗体、环状分子等结构更加复杂的药物形式,从而覆盖更广泛的候选分子空间。统一建模的理念也为模型的可控性和可解释性研究提供了契机,有望进一步推进生成模型向更可信、更实用的分子设计平台发展。总之,UniMoMo 的提出不仅为分子设计任务提供了一个通用而强大的生成框架,也为 AI 驱动的药物发现打开了一个充满潜力的新方向。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。