mindelec.data.ExistedDataset

class mindelec.data.ExistedDataset(name=None, data_dir=None, columns_list=None, data_format='npy', constraint_type='Label', random_merge=True, data_config=None)[源代码]

使用给定的数据路径创建数据集。

说明

目前支持 npy 数据格式。

参数:
  • name (str, 可选) - 指定数据集的名称(默认值=None)。如果 data_config 为None,则 name 应不是None。

  • data_dir (Union[str, list, tuple], 可选) - 已存在数据文件的路径(默认值=None)。如果 data_config 为None, data_dir 不应为None。

  • columns_list (Union[str, list, tuple], 可选) - 数据集的列名列表(默认值=None)。如果 data_config 为None, columns_list 不应为None。

  • data_format (str, 可选) - 现有数据文件的格式(默认值=’npy’)。

  • constraint_type (str, 可选) - 指定创建的数据集的约束类型(默认值=”Label”)。

  • random_merge (bool, 可选) - 指定是否随机合并给定的数据集(默认值=True)。

  • data_config (ExistedDataConfig, 可选) - ExistedDataConfig实例,收集上述的信息(默认值=None)。如果非None,则将通过使用它来简化创建数据集类。如果为None,则(name, data_dir, columns_list, data_format, constraint_type, random_merge)的信息用于替换。

异常:
  • ValueError - 当 data_config 为None时,参数 name / data_dir / columns_list 为None。

  • TypeError - 如果 data_config 不是ExistedDataConfig的实例。

  • ValueError - 如果 data_format 不是’npy’。

支持平台:

Ascend

样例:

>>> from mindelec.data import ExistedDataConfig, ExistedDataset
>>> data_config = ExistedDataConfig(name='exist',
...                                 data_dir=['./data.npy'],
...                                 columns_list=['input_data'], data_format="npy", constraint_type="Equation")
>>> dataset = ExistedDataset(data_config=data_config)