长短期记忆 (LSTM) 是一种递归神经网络,专用于防止给定输入的神经网络输出在通过反馈回路循环时发生衰减或爆炸。反馈回路可以使递归网络比其他神经网络更出色地进行模式识别。输入过去的记忆对于攻克序列学习任务至关重要,与其他 RNN 结构相比,长短期记忆网络可以通过缓解所谓的梯度消失问题,进而提供更卓越的性能。
由于 LSTM 具有学习长期依赖关系的能力,因而适于解决众多序列学习问题,其中包括语言建模和翻译、语音声学建模、语音合成、语音识别、音频和视频数据分析、手写识别和生成、序列预测和蛋白质二级结构预测。