mindspore.dataset.vision.MixUpBatch

查看源文件
class mindspore.dataset.vision.MixUpBatch(alpha=1.0)[源代码]

对输入批次的图像和标注应用混合转换。从批处理中随机抽取两个图像,其中一个图像乘以随机权重 (lambda),另一个图像乘以 (1 - lambda),并相加。该处理将会同时应用于one-hot标注。

上述的 lambda 是根据指定的参数 alpha 生成的。计算方式为在 [alpha, 1] 范围内随机生成两个系数 x1,x2 ,然后 lambda = (x1 / (x1 + x2))。

请注意,在调用此处理之前,您需要将标注制作成 one-hot 格式并进行batch操作。

参数:
  • alpha (float, 可选) - β分布的超参数,该值必须为正。默认值: 1.0

异常:
  • TypeError - 如果 alpha 不是float类型。

  • ValueError - 如果 alpha 不是正数。

  • RuntimeError - 如果输入图像的shape不是 <N, H, W, C> 或 <N, C, H, W>。

支持平台:

CPU

样例:

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.vision as vision
>>> import mindspore.dataset.transforms as transforms
>>>
>>> # Use the transform in dataset pipeline mode
>>> data = np.random.randint(0, 255, size=(64, 64, 3)).astype(np.uint8)
>>> numpy_slices_dataset = ds.NumpySlicesDataset(data, ["image"])
>>> numpy_slices_dataset = numpy_slices_dataset.map(
...     operations=lambda img: (data, np.random.randint(0, 5, (3, 1))),
...     input_columns=["image"],
...     output_columns=["image", "label"])
>>> onehot_op = transforms.OneHot(num_classes=10)
>>> numpy_slices_dataset= numpy_slices_dataset.map(operations=onehot_op,
...                                                input_columns=["label"])
>>> mixup_batch_op = vision.MixUpBatch(alpha=0.9)
>>> numpy_slices_dataset = numpy_slices_dataset.batch(5)
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=mixup_batch_op,
...                                                 input_columns=["image", "label"])
>>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     print(item["image"].shape, item["image"].dtype)
...     print(item["label"].shape, item["label"].dtype)
...     break
(5, 64, 64, 3) uint8
(5, 3, 10) float32
>>>
>>> # Use the transform in eager mode
>>> data = np.random.randint(0, 255, (2, 10, 10, 3)).astype(np.uint8)
>>> label = np.array([[0, 1], [1, 0]])
>>> output = vision.MixUpBatch(1)(data, label)
>>> print(output[0].shape, output[0].dtype)
(2, 10, 10, 3) uint8
>>> print(output[1].shape, output[1].dtype)
(2, 2) float32
教程样例: