大数跨境
0
0

精度、效率与泛化能力兼顾的Atomic Cluster Expansion机器学习势函数

精度、效率与泛化能力兼顾的Atomic Cluster Expansion机器学习势函数 源资科技VASP
2025-09-02
2
导读:钛,Atomic Cluster Expansion,原子团簇展开,机器学习势函数

☝点击图片查看培训详情,免费报名。


Part 1

背景介绍

MedeA中MLP&MLPG机器学习力场模块能结合第一性原理计算构建训练集,对局部化学环境描述,从而训练机器学习力场。经过训练的MLP力场能适用于基于训练集的较多构型,且计算精度与第一性原理计算精度保持一致。ACE势函数被认为是目前比较完整的、兼顾精度、效率、泛化能力的机器学习势函数之一,其在特殊情况下包含了多种其它方法如Gaussain Approximation Potential,SNPA,MTP。本算例中采用MedeA MLPG中Atomic Cluster Expansion(ACE)势函数训练生成Ti机器学习力场。


使用模块:

  • MedeA Environment

  • MedeA MLP&MLPG




Part 2

实操案例

01

给定的训练集

File → Fitting Data Manger → Ti-trainingset.fts(提供的) → Open



02

MLPG-Ti-力场训练

Jobs → New Job,显示流程图面板



点击右侧MLP Generator,流程图中加上MLP Generator组件



双击MLP Generator,设置相关参数:

• Training Set:XX/Desktop/Structure/ Ti-trainingset.fts(Ti-trainingset.fts具体位置)

• Type of machine-learned potential:ACE(选择ACE作为机器学习势函数)

• Global cutoff,近邻原子列表的载断距离,默认6 Å。注意:需要测试不同截断距离保证计算精度与速率的平衡

• Number of functions,每个元素采用多少个函数用来描述势场,用于微调训练精度与效率。

• Minimum relative change in loss for training set与Minimum relative change in loss for validation set,拟合收敛标准,达到两条收敛标准势函数拟合结束。

• Minimum number of iterations与Maximum number of iterations ,最大/最小训练次数。

• Relative weight of forces,训练过程中,力相对于能量的权重。默认是0.3,但是可以通过微调力的权重获得更好的拟合结果。

• Fraction of data to use as test set,测试集的比例,默认0.1,一般不需要调整、

• Run on,默认在CPU上训练,也可选择在GPU上训练



点击Advanced面板:

• Refine potential, 用于重新拟合已存在的势函数。已存在的势函数可以跟新的势函数是同一个训练集,也可以是新势函数训练集的子集。

• Batch size,用于评估损失函数的batch size,也能控制拟合过程使用的内存大小。如果拟合时存在内存不足的问题,可以将数值从10调整到6.

• Manually set inner cutoff,排斥项的截断距离,在距离过近的原子之间增加惩罚能量项

• L1-regularization coefficient,L2-regularization coefficient,正则化系数,防止过拟合的超参数,提升泛华能量,使势函数预测更平滑稳定。

• Manual seed for random numbers,随机种子

• Weighting scheme,权重机制,默认是Uniform。可选为Energy机制,此时,高能量结构的权重是降低,拟合过程将集中在平衡结构或接近平衡的结构。当训练集中高能量结构且需要考虑这些高能结构时,Uniform机制会更好,并且不会导致势函数训练的质量。

• Create active set inverted from training set,生成一个针对训练集的主动集反演文件(.asi)。该文件用于在拟合数据管理器中检查最优设计,或对创建的势函数使用LAMMPS进行外推分析。


点击Potential definition,可以对ACE势函数模型进行设置:

• Embedding,Bonds,修改ACE势函数定义。



点击OK,返回主流程图。

修改Job title,点击Run,设置队列及核数,提交作业计算


03

结果分析

3.1  Job.out分析

第一部分:重点计算参数



第二部分:拟合结果,包含能量、力、应力等


生成的力场文件为Stage目录下Ti-trainingset.frc

注意:如果需要使用该力场,下载.frc文件并放置在MD/data/Forcefields/custom路径下。计算时通过Forcefields→Open,选择保存的力场即可。


3.2 图形分析

点击对应Job序号,进入MLPG-Ti-training set作业中,点击Stage_1;图形文件在Other files in ./Stage_1中



Energy_DFT_vs_MLP.png,Forces_DFT_vs_MLP.png:DFT计算能量、受力与MLP预测能量、受力之间的相关性。在斜率为1的拟合线附近的值,表示误差较小,力场精度较高。



Energies_Difference_DFT_vs_MLP.png,Forces_Difference_DFT_vs_MLP.png:MLP与DFT计算能量、受力偏差。



Energy_Error_Distribution_TrainingSet.png,Forces_Error_Distribution_TrainingSet.png:MLP预测能量、受力的误差直方图。算例误差以0为中心分布。



在测试集上的能量、受力误差分布直方图如下:



-END-






源资科技VASP媒体平台




【声明】内容源于网络
0
0
源资科技VASP
1234
内容 1464
粉丝 0
源资科技VASP 1234
总阅读1.1k
粉丝0
内容1.5k