使用循环神经网络预测汇率涨跌

dalalaa

2018-04-15

使用循环神经网络预测汇率涨跌

本文中讲简单地介绍如何使用时间序列分析的方法预测汇率变化。

序列问题

首先介绍一下序列问题，常见的机器学习问题都是是一对一的模型，如下图所示：

一对一模型

在这个例子中，我们将一个输入数据传入到模型中，然后模型会根据传入数据生成一个结果，像线性回归，分类问题甚至图像分类卷积神经网络都属于这种类型。

这种模式经过修改可以用于处理一对多模型，如下图所示，模型的输出数据会作为新的输入数据传入回神经网络中，从而产生一系列的值，这种神经网络叫做循环神经网络。

循环神经网络

对于序列型的输入数据，循环神经网络的工作方式如下图所示，每个循环网络神经元的输出都会进入下一个神经元，作为下一个神经元的一部分输入数据：

循环神经网络处理序列问题

上面的网络中的每个神经元都使用同一个公式：

$Y_t = tanh(wY_{t-1} + ux_t)$

其中$Yt$是当前神经元的输出，$Y{t-1}$是上一个神经元的输出数据，$x_t$是当前神经元的原始输入，$w$和$u$都是权重参数。

可以通过简单地堆叠神经元来构建一个深层循环神经网络，但是简单的循环神经网络只能处理短时间记忆，对于需要长时间记忆的问题准确度会下降。

对于需要长时间依赖的序列分析问题，我们可以使用lstm神经网络来处理。

LSTM神经网络简介

在上世纪九十年代，Sepp Hochreiter和Jurgen Schmidhuber提出了LSTM神经网络，解决了传统的循环神经网络、隐马尔可夫模型和其他序列模型对长时间跨度不敏感的问题。

LSTM神经元内部结构

LSTM神经元在传统循环神经网络中添加了一些逻辑门，它们的功能如下：

1. 遗忘门

$f_t = \sigma(W_f[h_{t-1},x_t]+b_f)$

遗忘门会接受来自上一神经元的输出$h_{t-1}$以及当前神经元的输入$x_t$，通过线性变换之后传入sigmod函数，得到一个介于0到1的数字，这个数字可以认为是门的开度。这个数字会与内部状态相乘，所以这个门成为遗忘门，因为如果$f_t$为0时，当前的内部状态会被完全丢弃，如果$f_t$为1时，当前状态会保持完好无损。