mindspore.dataset.audio.MaskAlongAxis

class mindspore.dataset.audio.MaskAlongAxis(mask_start, mask_width, mask_value, axis)[源代码]

对音频波形应用掩码。掩码的起始和长度由 [mask_start, mask_start + mask_width) 决定。

参数：

mask_start (int) - 掩码的起始位置，必须为非负值。
mask_width (int) - 掩码的宽度，必须大于0。
mask_value (float) - 填充到掩码区间的值。
axis (int) - 要应用掩码的轴， 1 表示频率， 2 表示时间。

异常：

ValueError - 如果 mask_start 小于0。
ValueError - 如果 mask_width 小于1。
ValueError - 如果 axis 的值不在[1, 2]范围内。

支持平台：

CPU

样例：

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.audio as audio
>>>
>>> # Use the transform in dataset pipeline mode
>>> waveform = np.random.random([5, 20, 20])  # 5 samples
>>> numpy_slices_dataset = ds.NumpySlicesDataset(data=waveform, column_names=["audio"])
>>> transforms = [audio.MaskAlongAxis(0, 10, 0.5, 1)]
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=transforms, input_columns=["audio"])
>>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     print(item["audio"].shape, item["audio"].dtype)
...     break
(20, 20) float64
>>>
>>> # Use the transform in eager mode
>>> waveform = np.random.random([20, 20])  # 1 sample
>>> output = audio.MaskAlongAxis(0, 10, 0.5, 1)(waveform)
>>> print(output.shape, output.dtype)
(20, 20) float64

教程样例：

音频变换样例库