mindspore.nn.Embedding

class mindspore.nn.Embedding(vocab_size, embedding_size, use_one_hot=False, embedding_table='normal', dtype=mstype.float32, padding_idx=None)[源代码]

嵌入层。

用于存储词向量并使用索引进行检索，根据输入Tensor中的id，从 embedding_table 中查询对应的embedding向量。当输入为id组成的序列时，输出为对应embedding向量构成的矩阵。

警告

2.9.0（不含）之后版本中，构造签名将调整为 Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2.0, scale_grad_by_freq=False, sparse=False, dtype=None) 。其中参数名 vocab_size 和 embedding_size 将分别改为 num_embeddings 和 embedding_dim；use_one_hot 和 embedding_table 参数将被移除。

说明

当 use_one_hot 等于True时，x的类型必须是mindspore.int32。

参数：

vocab_size (int) - 词典的大小。
embedding_size (int) - 每个嵌入向量的大小。
use_one_hot (bool) - 指定是否使用one-hot形式。默认值： False 。
embedding_table (Union[Tensor, str, Initializer, numbers.Number]) - embedding_table的初始化方法。当指定为字符串，字符串取值请参见类 mindspore.common.initializer 。默认值： "normal" 。
dtype (mindspore.dtype) - x的数据类型。默认值： mstype.float32 。
padding_idx (int, None) - 将 padding_idx 对应索引所输出的嵌入向量用零填充。默认值： None 。该功能已停用。

输入：

x (Tensor) - Tensor的shape为 \((\text{batch_size}, \text{x_length})\) ，其元素为整数，并且元素数目必须小于等于vocab_size，否则相应的嵌入向量将为零。该数据类型可以是int32或int64。

输出：

Tensor的shape \((\text{batch_size}, \text{x_length}, \text{embedding_size})\) 。

异常：

TypeError - 如果 vocab_size 或者 embedding_size 不是整数。
TypeError - 如果 use_one_hot 不是布尔值。
ValueError - 如果 padding_idx 是一个不在[0, vocab_size ]范围内的整数。

支持平台：

Ascend GPU CPU

样例：

>>> import mindspore
>>> from mindspore import Tensor, nn
>>> import numpy as np
>>> net = nn.Embedding(20000, 768,  True)
>>> x = Tensor(np.ones([8, 128]), mindspore.int32)
>>> # Maps the input word IDs to word embedding.
>>> output = net(x)
>>> result = output.shape
>>> print(result)
(8, 128, 768)