大数跨境

2025年了,LSTM还能做吗?看看这些登上Nature的LSTM改进模型

2025年了,LSTM还能做吗?看看这些登上Nature的LSTM改进模型 学姐带你玩AI
2025-08-05
180

2025年,LSTM虽非最前沿模型,但其稳定的记忆能力与良好的可解释性,使其在工业、医疗等高稳健性要求的领域仍具不可替代价值。尤其在对稳定性与可复现性要求较高的场景中,LSTM的重要性持续上升。

LSTM的改进仍是学术界与工业界的重要研究方向。作为成熟结构,其技术积累深厚,适合追求稳妥创新的研究者切入。当前创新路径不仅限于传统变体设计,更包括与Transformer、注意力机制、CNN等模型的融合,这类混合架构通常实现简便且能有效提升性能。

为助力研究人员高效获取参考资料,本文梳理了LSTM创新研究的核心方向,并精选代表性论文进行解析,涵盖可复现代码支持的研究成果,供科研工作参考借鉴。

LSTM+卡尔曼滤波

An end-cloud collaboration approach for state-of health estimation of lithium-ion batteries based on bi-LSTM with collaboration of multi-feature and attention mechanism

方法:提出一种端云协同的锂离子电池健康状态(SOH)估计方法,云端采用带注意力机制的Bi-LSTM模型进行高精度分析,端侧使用双指数经验模型实现实时评估,通过扩展卡尔曼滤波器(EKF)融合两端输出,兼顾精度与响应速度。

创新点:

  • 构建端云协作框架,利用EKF融合深度学习与经验模型结果,平衡精度与实时性。
  • 在云端Bi-LSTM中引入注意力机制,强化关键特征提取能力,提升预测准确性。
  • 基于多特征分析筛选与电池退化强相关的输入变量,增强模型鲁棒性与泛化能力。

LSTM+PINN

Physics-Informed LSTM-Based Delay Compensation Framework for Teleoperated UGVs

方法:提出一种物理信息驱动的LSTM(PiLSTM)延迟补偿框架,用于低速无人地面车辆(UGV)的遥操作控制。通过结合LSTM网络与系统物理约束,预测运动指令与力反馈信号,有效补偿网络传输延迟,提升操作透明度与系统响应性能。

创新点:

  • 构建PiLSTM预测框架,将物理规律嵌入LSTM结构,提升模型在动态环境下的泛化能力。
  • 有效补偿遥操作中的网络延迟,在闭环实验中验证了对真实延迟的适应性。
  • 显著提高双边遥操作系统的性能与透明度,适用于低速UGV等安全敏感场景。

LSTM+Transformer

Temporal Fusion Transformers for Streamflow Prediction: Value of Combining Attention with Recurrence

方法:提出时间融合Transformer(TFT)模型,融合LSTM的序列建模能力与Transformer的注意力机制,用于径流预测。在2610个全球流域上的实验证明,TFT在预测精度和可解释性方面均优于单一结构模型。

创新点:

  • 构建TFT模型,结合LSTM的递归特性与Transformer的注意力机制,提升长期依赖捕捉能力。
  • 在全球大规模流域数据集上验证有效性,性能优于传统LSTM与Transformer。
  • 通过变量选择网络与注意力权重提供可解释性,便于模型分析与工程应用。

LSTM+CNN

Chess Rating Estimation from Moves and Clock Times Using a CNN-LSTM

方法:构建RatingNet模型,利用CNN提取棋盘位置特征,与剩余时钟时间数据融合后输入双向LSTM,实现从走子序列中自动预测玩家等级分。无需人工特征,测试MAE为182分,时钟信息显著提升预测精度。

创新点:

  • 完全摒弃手工特征,仅依赖走子序列以及时钟数据实现等级分估计,开辟新研究路径。
  • 实现每步后的实时预测,动态反映棋手当前水平,突破传统静态评估局限。
  • 验证时钟时间对预测性能的增益作用,尤其在快棋场景中误差更低,具备实际应用价值。
【声明】内容源于网络
0
0
学姐带你玩AI
1234
内容 854
粉丝 0
学姐带你玩AI 1234
总阅读26.7k
粉丝0
内容854