class mindspore_rl.environment.Space(feature_shape, dtype, low=None, high=None, batch_shape=None)[源代码]

包含环境动作/状态空间的类。

参数:
  • feature_shape (Union[list(int), tuple(int), int]) - 批处理前的动作/状态的Shape。

  • dtype (np.dtype) - 动作/状态空间的数据类型。

  • low (Union[int, float],可选) - 动作/状态空间的下边界。默认:None。

  • high (Union[int, float],可选) - 动作/状态空间的上边界。默认:None。

  • batch_shape (Union[list(int), tuple(int), int],可选) - 矢量化的批量Shape。通常用于多环境和多智能体的场景。默认:None。

样例:

>>> action_space = Space(feature_shape=(6,), dtype=np.int32)
>>> print(action_space.ms_dtype)
Int32
property boundary

当前Space的边界。

返回:

当前空间的上下边界。

property is_discrete

当前Space是否为离散。

返回:

是否为离散空间。

property ms_dtype

当前Space的MindSpore数据类型。

返回:

当前空间的MindSpore的数据类型。

property np_dtype

当前Space的numpy数据类型。

返回:

当前空间的Numpy的数据类型。

property num_values

当前Space的可用动作数量。

返回:

当前空间可选动作的数量。

sample()[源代码]

从当前Space里随机采样一个合法动作。

返回:
  • action (Tensor) - 一个合法动作的Tensor。

property shape

批处理后的shape。

返回:

批处理后的Space的Shape。