神经网络算法 - 一文搞懂RNN（循环神经网络） - 文章 - 开发者社区

本文将从 RNN解决了什么问题、 R NN的基本原理、RNN 的优化算法 、 RNN的 应用场景 四个方面，带您一文搞懂循环神经网络RNN 。

一、R NN解决了什么问题

传统神经网络算法存在局限：

输入输出一一对应： 传统神经网络算法

通常是 一个输入对应一个输出 ，这种严格的对应关系限制了其在处理复杂任务时的灵活性。

picture.image

RNN解决问题：

序列数据处理：RNN能够处理 多个输入对应多个输出 的情况，尤其适用于序列数据，如时间序列、语音或文本，其中每个输出与 当前的及之前的输入都有关 。
循环连接：RNN中的循环连接使得网络能够 捕捉输入之间的关联性 ，从而利用先前的输入信息来影响后续的输出。

二、 R NN的基本原理

构成部分：

picture.image

输入层- 隐藏层 - 输出层

下面通过一个具体的案例来看看RNN的基本原理。例如，用户说了一句“what time is it?”， 需要判断用户的说话意图，是问时间，还是问天气？

****基本原理

：****

先对句子“what time is it ?” 进行分词，然后按照顺序输入。

对句子进行分词

隐藏层 ：在此过程中，我们注意到前面的所有输入都对后续的输出产生了影响。圆形隐藏层不仅考虑了当前的输入，还综合了之前所有的输入信息， 能够利用历史信息来影响未来的输出 。

前面所有的输入都对后续的输出产生了影响

生成最终的预测结果：Asking for the time。

输出结果：Asking for the time

三、 RNN 的优化算法

picture.image

从RNN到LSTM：

处理长序列数据： RNN在处理长序列数据时，很难记住很久之前的输入信息 。就像你试图回忆几年前的某件事情，可能会觉得很难。LSTM通过引入“细胞状态”这个概念，就像一个记事本，可以一直记住前面的信息，解决了这个问题。
梯度消失和爆炸：想象一下，你正在爬楼梯，后面的楼梯突然消失了， 这就是RNN在处理时间序列数据时面临的问题 。LSTM通过引入“门控机制”，即一种选择性记忆的方式，保留重要信息并忽略不重要信息。 说人话就是，敲黑板、划重点 。

picture.image

RNN与LSTM对比

从 LSTM 到 GRU ：

LSTM与GRU对比

四、 RNN的 应用场景

处理数据 ：

处理

文本中单词或字符的时序关系，并进行文本的分类或翻译。

****实际应用

：****

典型场景：对话生成。

典型场景：在线翻译。

将视频分解为一系列关键帧，并为每个帧生成内容匹配的文本描述。典型场景：生成视频摘要。