科技 > 数码 > 正文

从动图中理解 RNN，LSTM 和 GRU

雷锋网

下载客户端
独家抢先看

2019年07月15日 14:42:00 来自广东

递归神经网络(RNNs)是一类常用的序列数据人工神经网络。三种最常见的递归神经网络类型分别是：

vanilla RNN

长短记忆RNN(LSTM)，由 Hochreiter和 Schmidhuber 在1997年提出

门控循环单元(GRU)，由Cho等人在2014年提出賽普·霍克賴特

要指出的一点是，我将使用"RNNS"来统称本质上是递归神经网络结构，"vanilla RNN"来指代在图一所展示的最简单的循环神经网络结构.

有很多关于递归神经网络的图解.

我个人最喜欢的一个是Michael Nguyen发表在《走向数据科学》(Towards Data Science)的这篇文章，因为他不仅给我们提供了对这些模型的直觉，更重要的是这些漂亮的插图，使我们更容易理解。但我发表这篇文章的动机是为了更好地理解这些单元中发生了什么，节点是如何共享的，以及它们是如何转换为输出节点。这里，我也受到了Michael的动画启发。

本文研究了vanilla RNN、LSTM和GRU单元。这是一个简短的概述，是为那些读过关于这些主题的文章的人准备的。(我建议在阅读本文之前先阅读Michael的文章)，需要注意的是，以下动画是按顺序引导的，但在向量化的机器计算过程中并不反映时间上的顺序。

下面是我用来做说明的图例：

图0：动画图例

在我的动画中，我使用了大小为3(绿色)的输入和2个隐藏单元(红色)，批量大小为1。

让我们开始吧！

Vanilla RNN

图1：vanilla RNN 示意动画

t—时间步长

X—输入

h—隐藏状态

X的长度—输入的大小

h的长度—隐藏单元。

请注意不同的库以不同的方式调用它们，但它们的含义相同：

- Keras — state_size ,units

- PyTorch — hidden_size

- TensorFlow — num_units

LSTM（长短期记忆网络）

图2：LSTM 示意动画
- C - 单元状态
  
  注意，单元状态的维度与隐藏状态的维度相同。
  
  GRU
  
  图3：GRU 示意动画
  
  希望这些动画能以某种方式帮助你！以下是静态图像中的概况：
  
  图4：Vanilla RNN 单元
  
  图5：LSTM 单元
  
  图6：GRU 单元
  
  一个提醒：我使用Google绘图来创建的这些示意图。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

从动图中理解 RNN，LSTM 和 GRU

亲爱的凤凰网用户:

第三方浏览器推荐: