2025年,LSTM虽非最前沿模型,但其稳定的记忆能力与良好的可解释性,使其在工业、医疗等高稳健性要求的领域仍具不可替代价值。尤其在对稳定性与可复现性要求较高的场景中,LSTM的重要性持续上升。
LSTM的改进仍是学术界与工业界的重要研究方向。作为成熟结构,其技术积累深厚,适合追求稳妥创新的研究者切入。当前创新路径不仅限于传统变体设计,更包括与Transformer、注意力机制、CNN等模型的融合,这类混合架构通常实现简便且能有效提升性能。
为助力研究人员高效获取参考资料,本文梳理了LSTM创新研究的核心方向,并精选代表性论文进行解析,涵盖可复现代码支持的研究成果,供科研工作参考借鉴。
LSTM+卡尔曼滤波
An end-cloud collaboration approach for state-of health estimation of lithium-ion batteries based on bi-LSTM with collaboration of multi-feature and attention mechanism
方法:提出一种端云协同的锂离子电池健康状态(SOH)估计方法,云端采用带注意力机制的Bi-LSTM模型进行高精度分析,端侧使用双指数经验模型实现实时评估,通过扩展卡尔曼滤波器(EKF)融合两端输出,兼顾精度与响应速度。
创新点:
- 构建端云协作框架,利用EKF融合深度学习与经验模型结果,平衡精度与实时性。
- 在云端Bi-LSTM中引入注意力机制,强化关键特征提取能力,提升预测准确性。
- 基于多特征分析筛选与电池退化强相关的输入变量,增强模型鲁棒性与泛化能力。
LSTM+PINN
Physics-Informed LSTM-Based Delay Compensation Framework for Teleoperated UGVs
方法:提出一种物理信息驱动的LSTM(PiLSTM)延迟补偿框架,用于低速无人地面车辆(UGV)的遥操作控制。通过结合LSTM网络与系统物理约束,预测运动指令与力反馈信号,有效补偿网络传输延迟,提升操作透明度与系统响应性能。
创新点:
- 构建PiLSTM预测框架,将物理规律嵌入LSTM结构,提升模型在动态环境下的泛化能力。
- 有效补偿遥操作中的网络延迟,在闭环实验中验证了对真实延迟的适应性。
- 显著提高双边遥操作系统的性能与透明度,适用于低速UGV等安全敏感场景。
LSTM+Transformer
Temporal Fusion Transformers for Streamflow Prediction: Value of Combining Attention with Recurrence
方法:提出时间融合Transformer(TFT)模型,融合LSTM的序列建模能力与Transformer的注意力机制,用于径流预测。在2610个全球流域上的实验证明,TFT在预测精度和可解释性方面均优于单一结构模型。
创新点:
- 构建TFT模型,结合LSTM的递归特性与Transformer的注意力机制,提升长期依赖捕捉能力。
- 在全球大规模流域数据集上验证有效性,性能优于传统LSTM与Transformer。
- 通过变量选择网络与注意力权重提供可解释性,便于模型分析与工程应用。
LSTM+CNN
Chess Rating Estimation from Moves and Clock Times Using a CNN-LSTM
方法:构建RatingNet模型,利用CNN提取棋盘位置特征,与剩余时钟时间数据融合后输入双向LSTM,实现从走子序列中自动预测玩家等级分。无需人工特征,测试MAE为182分,时钟信息显著提升预测精度。
创新点:
- 完全摒弃手工特征,仅依赖走子序列以及时钟数据实现等级分估计,开辟新研究路径。
- 实现每步后的实时预测,动态反映棋手当前水平,突破传统静态评估局限。
- 验证时钟时间对预测性能的增益作用,尤其在快棋场景中误差更低,具备实际应用价值。

