图1. 贝叶斯优化高分子立体选择聚合反应的工作流程。
首先,研究者从文献报道的56个salen-和salan-型对称的铝催化剂的催化聚合过程中提取描述符(descriptor),并开始进行机器学习模型训练。经过不同研究者发现使用通过DFT(density function theory)描述符生成的数据集可以实现一致的回归性能,即具有最低的均值误差和标准差。在Pm和Pr值的优化过程中,通过贝叶斯优化方法中的高斯过程回归替代模型(Gaussian process regression surrogate model),在经过7次迭代后就实现了收敛;而随机搜索过程在经过12次迭代后仍未实现收敛。这说明基于高斯过程回归的贝叶斯优化模型相较于随机搜索过程具有更高的搜索效率(图2)。