mindspore.ops.ReduceScatterV
- class mindspore.ops.ReduceScatterV(op=ReduceOp.SUM, group=GlobalComm.WORLD_COMM_GROUP)[源代码]
规约并且分发指定通信组中不均匀的张量,返回分发后的张量。
说明
只支持一维的输入,使用该接口前需要将输入数据展开成一维。
- 参数:
op (str, 可选) - 指定用于元素的规约操作,如SUM、MIN和MAX,当前不支持PROD。默认值:
ReduceOp.SUM
。group (str,可选) - 工作的通信组,默认值:
GlobalComm.WORLD_COMM_GROUP
(即Ascend平台为"hccl_world_group"
,GPU平台为"nccl_world_group"
)。
- 输入:
input_x (Tensor) - 一维待分发的张量,shape为 \((x_1)\)。
input_split_sizes (Union[tuple[int], list[int], Tensor]) - 一维张量,所有rank的接收数据量列表,基本单位是Tensor的数据类型。该数值未作校验,由用户保障其正确性。
- 输出:
Tensor,从每张卡上规约并且分发的一维数据结果。如果结果为空,则返回空张量,且值无意义。
- 异常:
RuntimeError - 目标设备无效、后端无效,或者分布式初始化失败。
- 支持平台:
Ascend
GPU
样例:
>>> import mindspore as ms >>> from mindspore import Tensor >>> from mindspore.communication import init, get_rank >>> from mindspore.ops import ReduceOp >>> import mindspore.nn as nn >>> from mindspore.ops.operations.comm_ops import ReduceScatterV >>> >>> ms.set_context(mode=ms.GRAPH_MODE) >>> init() >>> class Net(nn.Cell): ... def __init__(self): ... super(Net, self).__init__() ... self.reducescatterv = ReduceScatterV(ReduceOp.SUM) ... ... def construct(self, x, input_split_sizes): ... return self.reducescatterv(x, input_split_sizes) ... >>> rank = get_rank() >>> input_x = Tensor([0, 1, 2.0]) >>> input_split_sizes = [2, 1] >>> net = Net() >>> output = net(input_x, input_split_sizes) >>> print(output) rank 0: [0. 2.] rank 1: [4.]