资讯：The Innovation Informatics | 神经网络波函数优化：现状、挑战与AI驱动的量子多体计算前景- 大数跨境

资讯：The Innovation Informatics | 神经网络波函数优化：现状、挑战与AI驱动的量子多体计算前景

两江科技评论

2025-12-12

导读：本篇观点文章聚焦于NN-VMC计算中最核心的波函数优化环节，系统回顾方法发展、核心瓶颈与未来方向，展现AI赋能量子科学的巨大潜力。

随着 AI for Science 成为科研范式转型的重要方向，基于神经网络的波函数建模使多电子薛定谔方程的求解精度迈上新的台阶。然而因其高度复杂性及神经网络变分蒙特卡洛(Neural Network-based Variational Monte Carlo, NN-VMC) 中的随机噪声与崎岖损失景观等因素，波函数优化成为当前研究的关键瓶颈。本文撰写的初衷是梳理波函数优化方法的发展脉络，分析当前挑战并探讨未来研究的可行路径，助力AI 赋能的量子多体计算迈向更广阔的应用。

导读

NN-VMC能够以远低于传统高精度量子化学方法的计算代价，实现多电子薛定谔方程求解的精度飞跃。本篇观点文章聚焦于NN-VMC计算中最核心的波函数优化环节，系统回顾方法发展、核心瓶颈与未来方向，展现AI赋能量子科学的巨大潜力。

图1 (A) 氮气分子基态能量示意图; (B) NN-VMC计算流程; (C) 多电子薛定谔方程求解方法精度与计算代价对比; (D) SR方法示意图; (E) 多电子薛定谔方程求解方法的精度与最大计算体系对比。

求解多电子薛定谔方程是量子物理、量子化学、材料科学等众多研究领域的核心难题。电子之间的强关联与随电子数量增长导致的维数灾难使传统高精度方法计算代价极高。

近年来，神经网络波函数的兴起为VMC方法带来了突破，使其能够在远低于传统高精度方法的计算代价下达到，甚至在部分任务中超越材料科学等应用领域所需的化学精度，在精度与效率上展现出较大的潜在优势。

然而，求解一个高维、具有噪声、高度非线性的随机优化问题，使得训练过程成了NN-VMC的主要计算瓶颈。主流动量类优化方法 (如 Adam) 往往难以收敛。为此，研究者发展了多种物理启发的优化算法，其中以 Stochastic Reconfiguration (SR) 最具代表性。SR 本质上是一种在波函数空间采用自然梯度的优化方法，可显著加速收敛并提升训练稳定性。但其每次迭代均需要解一个规模与参数量相当的大型线性方程，这对百万级参数网络而言存在计算瓶颈。

为提升SR在NN-VMC中的可行性，研究者提出多种改进策略。例如，借鉴深度学习中近似自然梯度的K-FAC方法，对SR矩阵进行层级近似，显著降低计算复杂度；MinSR利用Sherman–Morrison公式将求解规模从参数量降至通常仅有数千个的采样点数量；SPRING则通过投影结构得到类似动量加速的更新方式，在小分子实验中表现优异。然而，这些方法普遍依赖超参数设置，并可能在某些场景下出现不稳定的现象，反映出我们仍缺乏对SR原理的系统理解。

除了SR系列，近似二阶方法也是解决NN-VMC计算瓶颈的重要方向。经典的线性方法 (Linear Method) 在小规模参数下极为有效，但其需要反复进行高维广义特征值的求解，无法应用于深度神经网络。Rayleigh–Gauss–Newton (RGN) 通过保留部分二阶信息实现加速，但需要多次额外反向传播，计算代价仍然过高，目前仅停留在小模型验证阶段。此外，基于几何与流形视角的方法也在兴起，例如基于Wasserstein度量的优化框架，或将SR和RGN解释为流形上的投影优化，并据此构造新算法。然而它们同样需要更多反向传播的计算，暂无法大规模实用。

综上，尽管现有方法已开展了大量研究，但NN-VMC波函数优化仍面临以下核心挑战：

更新方向选择困难：SR类方法本质上需要解决欠定问题，其解不唯一，缺乏选择最优更新的原则性准则。
理论理解不足：SR矩阵的谱性质、网络结构的影响机制等仍不明确，限制了算法的可解释性与改进空间。
Scaling Law尚未完整建立：在追求更高精度时盲目扩大网络规模，往往会造成巨大的计算资源浪费，亟需系统研究网络规模、网络架构与精度之间的规律。

针对这些瓶颈难点，本文梳理了未来可能的研究方向，包括：

从函数空间视角出发，将NN-VMC视为在无穷维单位球或概率流形上的泛函极小化问题，在该流形上采用黎曼优化方法，并在有限维参数化空间中近似实现。
开发随机场景下的低成本二阶近似，如拟牛顿法或其他近似牛顿算法。
建立超参数与稳定性之间的可解释联系，实现更可靠的自适应优化。
设计包含更强物理先验的多层级网络结构，以减少优化难度。
探索量子计算或新型计算架构，以加速NN-VMC的采样与计算步骤。

这些方向的研究进展或将共同推动NN-VMC向更大规模、更高精度、更复杂体系拓展。

总结与展望

神经网络的引入让VMC在量子多体计算中展现出前所未有的潜力。然而，要真正实现大规模应用落地，优化方法仍是关键瓶颈。未来，随着物理学、数值优化和机器学习进一步融合，新的理论与算法将不断涌现，使NN-VMC能够处理更复杂的分子与材料体系。 AI for Science的时代已经拉开帷幕，NN-VMC将成为推动基础科学迈向新高度的重要力量

扫二维码｜查看原文

原文链接：https://www.the-innovation.org/article/doi/10.59717/j.xinn-inform.2025.100025

本文内容来自The Innovation姊妹刊The Innovation Informatics第2卷第1期以Perspective发表的“Optimization of neural network wave functions in variational Monte Carlo” (投稿: 2025-09-24；接收: 2025-11-24；在线刊出: 2025-11-27)。

DOI:10.59717/j.xinn-inform.2025.100025

引用格式：Wang Y. and Liu X. (2025). Optimization of neural network wave functions in variational Monte Carlo. The Innovation Informatics 2:100025.

作者简介

刘歆，中国科学院数学与系统科学研究院研究员，担任计算数学与科学工程计算研究所副所长，中国科学院青年创新促进会理事长，中国工业与应用数学学会秘书长。研究方向为非线性优化的计算方法，及其在材料计算、机器学习等领域的应用。国家杰出青年科学基金项目获得者，国家重点研发计划项目首席科学家。

王宇扬，中国科学院数学与系统科学研究院计算数学专业博士生，研究方向为电子结构计算中的优化问题与算法。曾获华罗庚奖学金与中国科学院大学三好学生称号。

免责声明：本文旨在传递更多科研资讯及分享，所有其他媒、网来源均注明出处，如涉及版权问题，请作者第一时间后台联系，我们将协调进行处理，所有来稿文责自负，两江仅作分享平台。转载请注明出处，如原创内容转载需授权，请联系下方微信号。