mindspore.ops.LSTM

查看源文件
class mindspore.ops.LSTM(input_size, hidden_size, num_layers, has_bias, bidirectional, dropout, proj_size=0)[源代码]

对输入执行长短期记忆(LSTM)网络。

有关详细信息,请参见 mindspore.nn.LSTM

参数:
  • input_size (int) - 输入的大小。

  • hidden_size (int) - 隐藏状态大小。

  • num_layers (int) - LSTM的网络层数。

  • has_bias (bool) - Cell是否有偏置 b_ihb_hh

  • bidirectional (bool) - 是否为双向LSTM。

  • dropout (float) - 指的是除第一层外每层输入时的dropout概率。dropout的范围为[0.0, 1.0]。

  • proj_size (int) - 如果大于0,则会使用对应大小的投影,当前只支持CPU后端。默认值: 0

输入:
  • input (Tensor) - shape为 \((seq\_len, batch\_size, input\_size)\)\((batch\_size, seq\_len, input\_size)\) 的Tensor。

  • h (tuple) - shape为 \((num\_directions * num\_layers, batch\_size, real\_hidden\_size)\) 的Tensor。

  • c (tuple) - shape为 \((num\_directions * num\_layers, batch\_size, hidden\_size)\) 的Tensor。

  • w (Tensor) - 权重。

如果 \(proj\_size > 0\) , \(real\_hidden\_size = proj\_size\) , 否则 \(real\_hidden\_size = hidden\_size\)

输出:

tuple,tuple包含 (output, h_n, c_n, reserve, state)

  • output (Tensor) - shape为 \((seq\_len, batch\_size, num\_directions * real\_hidden\_size)\) 的Tensor。

  • h_n (Tensor) - shape为 \((num\_directions * num\_layers, batch\_size, real\_hidden\_size)\) 的Tensor。

  • c_n (Tensor) - shape为 \((num\_directions * num\_layers, batch\_size, hidden\_size)\) 的Tensor。

  • reserve (Tensor) - shape为 \((r, 1)\)

  • state (Tensor) - 使用随机数生成状态及其shape为 \((s, 1)\)

异常:
  • TypeError - 如果 input_sizehidden_sizenum_layers 不是int。

  • TypeError - 如果 has_biasbidirectional 不是bool。

  • TypeError - 如果 dropout 不是float。

  • ValueError - 如果 dropout 不在范围[0.0, 1.0]内。

  • ValueError - 如果 proj_size 不在范围[0, hidden_size)内。

支持平台:

GPU CPU

样例:

>>> import numpy as np
>>> from mindspore import Tensor, ops
>>> input_size = 10
>>> hidden_size = 2
>>> num_layers = 1
>>> seq_len = 5
>>> batch_size = 2
>>>
>>> net = ops.LSTM(input_size, hidden_size, num_layers, True, False, 0.0)
>>> input_tensor = Tensor(np.ones([seq_len, batch_size, input_size]).astype(np.float32))
>>> h0 = Tensor(np.ones([num_layers, batch_size, hidden_size]).astype(np.float32))
>>> c0 = Tensor(np.ones([num_layers, batch_size, hidden_size]).astype(np.float32))
>>> w = Tensor(np.ones([112, 1, 1]).astype(np.float32))
>>> output, hn, cn, _, _ = net(input_tensor, h0, c0, w)
>>> print(output)
[[[0.9640267  0.9640267 ]
  [0.9640267  0.9640267 ]]
 [[0.9950539  0.9950539 ]
  [0.9950539  0.9950539 ]]
 [[0.99932843 0.99932843]
  [0.99932843 0.99932843]]
 [[0.9999084  0.9999084 ]
  [0.9999084  0.9999084 ]]
 [[0.9999869  0.9999869 ]
  [0.9999869  0.9999869 ]]]