mindspore.ops.gelu
- mindspore.ops.gelu(input, approximate='none')[源代码]
高斯误差线性单元激活函数。
警告
从2.9.0(不含)之后版本开始,approximate 将调整为关键字参数。
GeLU的详细描述请参考 Gaussian Error Linear Units (GELUs) 。 相关应用可参考 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 。
当 approximate 为
'none',GELU的定义如下:\[GELU(x_i) = x_i*P(X < x_i),\]其中 \(P\) 是标准高斯分布的累积分布函数, \(x_i\) 是输入的元素。
当 approximate 为
'tanh',GELU的定义如下:\[GELU(x_i) = 0.5 * x_i * (1 + \tanh(\sqrt{\frac{2}{\pi}} * (x_i + 0.044715 * x_i^3)))\]GELU函数图:
- 参数:
input (Tensor) - 用于计算GELU的Tensor。
approximate (str,可选) - GELU近似算法。可选值为
'none'和'tanh'。默认'none'。
- 返回:
Tensor,具有与 input 相同的数据类型和shape。
- 异常:
TypeError - input 不是Tensor。
ValueError - approximate 的值不是
'none'或'tanh'。
- 支持平台:
AscendGPUCPU
样例:
>>> import mindspore >>> from mindspore import Tensor, ops >>> x = Tensor([1.0, 2.0, 3.0], mindspore.float32) >>> result = ops.gelu(x, approximate='none') >>> print(result) [0.8413447 1.9544997 2.9959505]