分子体系模拟与分子力场
分子体系模拟在生物大分子结构预测、药物筛选、有机材料筛选等领域具有重要应用价值。
分子体系的模拟中最重要的就是刻画体系势能函数、描述相互作用。在经典分子动力学模拟(CMD)中,势能函数遵循固定的数学形式,而分子力场即以数学函数的形式给出了分子间与分子内相互作用势。
传统力场的数学形式
然而,目前投入工业化应用的分子力场普遍面临着这样几个问题:
- 缺乏可移植性和预测能力:研究新体系时,在真正跑出结果之前,恐怕谁都不确定哪个力场结果更好。除了靠“经验”,谁也说不清楚力场应该怎么选。
- 参数缺少唯一性和一致性:经常出现多套完全不同的参数能给出相似的宏观预测,因此不能仅通过宏观数据确定微观上哪套参数更为合理。同时,我们也常常能看到非常相似的体系,力场参数却完全不同,因此不同课题组发展的力场往往不能组合使用。
机器学习与自动微分技术
在分子力场拟合领域,提起机器学习,绝大多数同学可能想到的是人工神经网络架构:
的确,不论是早期的 Behler-Parinello 模型、Schnet 模型,还是更近期的 DP 模型、或是 REANN 模型,其核心做法,都是将原子的势能面拆解为单个原子能量的求和:
并利用神经网络的超强拟合能力,以原子局域环境为输入特征(feature),构建原子能量函数:
然后利用大量的第一性原理数据对神经网络进行训练。人工智能技术在分子动力学领域掀起的这一波浪潮主要就是由神经网络势函数所带动。
但是,人工智能技术所带来的革新,绝不只是神经网络势函数。与神经网络模型发展相伴随的技术创新,包括强大的高维梯度下降算法,和底层的自动微分程序框架,都可以被传统力场开发者所用,这就是 DMFF 诞生的主要原因。
在神经网络训练过程中,我们需要通过反向传播,计算网络输出对网络参数的微分,并利用梯度下降实现整个神经网络的优化。因此,自动微分框架与机器学习模型的训练相伴而生,可以说自动微分技术本身就是为了大量数据下高维参数的高效优化而生。包括 DP 在内的神经网络势能面的训练,其实都是基于自动微分技术实现的。
基于反向传播自动微分算法的神经网络训练
DMFF 动手实践
尽管最早是被用于机器学习模型,但自动微分技术本身并不依赖于机器学习模型。需要微分和优化的计算流可以是任何物理模型。因此,我们完全可以利用自动微分和梯度下降技术,利用实验和第一性原理数据,经过反向传播去优化任何物理模型的参数。而 DMFF 正是这一想法在分子力场领域运用的实例。
通过 DMFF,我们对分子力场开发的两大难题作出回应:
- 如何保证分子动力学模拟过程中复杂力场的快速实现与迭代。
- 如何提升高维度函数中优化参数的效率以及这一过程的自动化程度,并提升参数的可迁移性。
在最新发布的 DMFF 0.2.0版本中,探索出了一条力场参数自动优化的路径,相应的工作流在比较简单的小分子体系与较为复杂的电解液体系中都得到了验证。
在下面的 Notebook 中,我们会“手把手”带你亲手构建分子力场、生成与拓展势函数、通过 DMFF 进行简单的拟合并以实际案例搭建力场参数优化的工作流。你无需担心环境配置和依赖问题,仅需要专注于学习本身。依靠免费的 2 核 4G 计算资源,你可以在平台上直接运行和修改代码。
Notebook 链接:https://nb.bohrium.dp.tech/detail/1254
通过这个 Notebook,相信你对以下问题已经有了更好的理解:
- 什么是 DMFF
- DMFF 的基本工作流
- DMFF 是如何实现力场的快速迭代与参数优化的
致谢:
感谢 Notebook 作者韩言博、陈俊敏、冯维、余旷老师的分享。感谢作者单位清华大学深圳国际研究生院的支持。
欢迎关注我们的微信公众号NBHub,获取更多有趣的 Notebook 实践~感兴趣的童鞋可以查看原文:https://mp.weixin.qq.com/s?__biz=Mzg5NTk3Nzk3MQ==&mid=2247483...
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。