1.1. 简介

在过去的几十年时间里,分子动力学(MD)模拟方法因为在凝聚态物理、材料科学、高分子化学和分子生物学等领域的广泛应用而受到了越来越多的关注。这种模拟手段为研究人员提供了观测原子或分子的运动行为的途径,对于拓宽我们的认知边界意义重大,尤其是在一些实验研究开展难度大、成本高甚至无法进行的情况下。

众所周知,MD模拟的质量取决于势能面的准确性,如何精确表示势能面是分子动力学模拟中极其重要的问题。经验原子间势函数模型与量子力学模型是长期以来最为常用的两种方法,经验原子间势函数模型由低维数项组成,通常计算效率高但精度受限。量子力学模型通过近似求解电子结构的薛定谔方程来计算原子的受力和能量,具有非常高的精度。然而,量子力学模型的计算要求非常高,很难应用于大规模或长时间的计算。总而言之,如何在高计算效率的经验原子间势函数模型和高计算精度的量子力学模型中做出取舍是研究人员面临的困境。

最近,机器学习(ML)模型的出现为解决这个难题提供了有力工具。描述符和ML算法是ML模型的两个主要组成部分。描述符用于保证结构的原有对称性,ML算法基于量子力学产生的数据进行训练,从而建立原子结构与体系能量之间的函数关系。训练完成后,ML模型能给出与训练数据相同等级的量子力学精度,即,如果训练数据是由密度泛函理论(DFT)计算得出,那么ML模型也会是DFT的精度。同时,DFT的计算量随着研究体系增大呈三次方增长,而ML模型的计算量只与体系大小呈线性关系。

到目前为止,文献已经报道了多种ML模型,例如Behler-Parrinello neural network potentials(BPNNP)[1], Gaussian approximation potentials(GAP)[2], spectral neighbor analysis potentials(SNAP)[3], ANI-1[4], SchNet[5] and Deep Potential[6,7,8]。值得一提的是,尽管已取得了较大成功,但ML模型仍面临很多极具挑战性的问题亟待解决[9],例如忽略截断半径外的相互作用导致的系统性预测误差[10]等。

本教程将重点介绍DP模型,除了媲美于量子力学的精度外,目前的DP模型还具有以下特点:(1)易于保持体系的对称性,尤其是当体系存在多种元素时;(2)计算效率高,比DFT至少快五个数量级;(3)端到端模型,减少人为干预的可能;(4)支持MPI和GPU,能够在现代异构高性能超级计算机上高效运行。基于以上优势,DP模型已经成功地应用于水和含水体系[11,12,13,14],金属和合金[15,16,17,18],相图[19,20,21],高熵陶瓷[22,23],化学反应[24,25,26],固态电解质[27],离子液体[28]等研究领域。关于DP在材料领域方面的近期研究,可以参考最近的综述[29]

翻译:区展鹏 校对:方满娣