都2025了,还能用LSTM发论文么?毫无疑问没问题!这不KI-GAN,便拿下了CVPR,实现了预测误差直降87%的显著效果;模型GRLSTM则中稿AAAI;还有ACL的DW-LSTM;各一区TOP期刊,也不乏其身影……
主要在于:其特有的门控机制,不仅能保障长序列建模的稳定性,避免梯度消失;还能满足轻量化、实时性、可解释性等垂直场景的需求。在医学、工业、金融等领域,都起着不可替代的作用!
更特别的是,其实现简单,计算效率高,还很容易的与其他技术结合,做模块缝合,非常好涨点出创新。
想发论文的伙伴,可以围绕LSTM架构改进(与Mamba、Transformer等结合)、动态门控机制设计、并行化改进等进行。为方便大家研究的进行,我给大家准备了122种创新思路,原文和源码都有!
扫描下方二维码,回复「长短改进」
免费获取全部论文合集及项目代码
xLSTM as Gene ric Vision Backbone
内容:这篇文章介绍了一种新的计算机视觉架构ViL,它是基于扩展的长短期记忆网络构建的。ViL通过交替处理图像块序列的方式,使得奇数层从上到下处理,偶数层从下到上处理,从而有效地处理非序列化的图像输入。实验表明,ViL在图像分类、迁移学习和分割任务上表现出色,具有良好的预训练成本与性能权衡。此外,ViL在高分辨率图像任务上展现出线性扩展的效率优势,与传统的Transformer架构相比,计算成本更低,且在性能上具有竞争力。
Time series prediction model using LSTM‑Transformer neural network for mine water inflow
内容:这篇文章提出了一种基于LSTM-Transformer神经网络的时间序列预测模型,用于预测矿山涌水量。该模型结合了Transformer的自注意力机制和LSTM捕捉长期依赖性的能力,以提高预测精度。文章以黑龙江宝泰龙矿的涌水量数据作为样本,通过不同比例的训练集和测试集划分来优化预测结果,并使用随机搜索和贝叶斯优化相结合的方法来确定网络模型参数和正则化参数。实验结果表明,LSTM-Transformer模型在预测精度上优于LSTM、CNN、Transformer和CNN-LSTM模型,且在模型指标上都有显著提升。
State-of-charge estimation of lithium-ion battery: Joint long short-term memory network and adaptive extended Kalman filter online estimation algorithm
内容:这篇文章提出了一种用于锂离子电池荷电状态(SOC)估计的联合长短期记忆循环神经网络(LSTM-RNN)和自适应扩展卡尔曼滤波器(AEKF)在线估计算法。该算法通过训练有素的LSTM-RNN生成初始SOC估计值,并将其作为反馈输入到AEKF中。研究结果表明,仅需30秒的时间序列作为LSTM-RNN的输入即可获得满意的估计结果。与传统的自适应扩展卡尔曼滤波器和反向传播神经网络相比,该算法在各种放电条件下表现出更高的估计精度。
扫描下方二维码,回复「长短改进 」
免费获取全部论文合集及项目代码
VMRNN:Integrating Vision Mamba and LSTM for Efficient and Accurate Spatiotemporal Forecasting
内容:本文提出了一种名为VMRNN的新型时空预测模型,该模型结合了Vision Mamba模块和LSTM架构,用于高效且准确的时空预测任务。VMRNN通过引入Vision Mamba模块来处理长序列建模,并利用LSTM捕捉时间序列中的长期依赖关系,从而在保持较小模型尺寸的同时,实现了对复杂时空动态的精确预测。实验结果表明,VMRNN在多个数据集上均取得了优异的性能,且在计算效率和预测精度上均优于现有的先进方法。
Chess Rating Estimation from Moves and Clock Times Using a CNN-LSTM
内容:这篇文章提出了一种基于深度学习的方法,用于直接从国际象棋的棋局走法和用时数据中估计棋手的等级分。该方法结合了卷积神经网络(CNN)和双向长短期记忆网络(LSTM),通过分析棋局中的位置特征和时间信息来预测棋手的等级分。研究者们从Lichess网站收集了超过120万局棋的数据,覆盖了不同的时间控制类型,并包含了详细的走法序列和用时数据。模型在测试数据上达到了182等级分的平均绝对误差(MAE),显示出该方法在棋手等级分估计方面的有效性。
Spatial-Temporal Bearing Fault Detection Using Graph Attention Networks and LSTM
内容:这篇文章提出了一种结合图注意力网络(GAT)和长短期记忆网络(LSTM)的新方法,用于工业机械中的轴承故障诊断。该方法通过将时间序列传感器数据转换为图表示,利用GAT捕捉组件之间的空间关系,同时利用LSTM建模时间模式,从而提高在不同条件下轴承故障检测的准确性。研究使用CWRU轴承数据集进行验证,该数据集包含不同马力水平下的正常和故障条件数据。结果表明,该模型在各种测试条件下均实现了100%的精确度、召回率和F1分数,并且能够有效地泛化到不同的操作场景中,优于传统方法。
扫描下方二维码,回复「长短改进」
免费获取全部论文合集及项目代码