mindformers.ModelRunner
- class mindformers.ModelRunner(model_path, npu_mem_size, cpu_mem_size, block_size, rank_id=0, world_size=1, npu_device_ids=None, plugin_params=None)[源代码]
用于将 MindFormers 的一个模型运行实例作为 MindIEServer 的后端。
- 参数:
model_path (str) - 包含模型配置文件(yaml 文件,tokenizer 文件)的模型路径。
npu_mem_size (int) - kv-cache 的 NPU 内存大小。
cpu_mem_size (int) - kv-cache 的 CPU 内存大小。
block_size (int) - kv-cache 的块大小。
rank_id (int, 可选) - 用于推理的 rank ID。默认值:
0。world_size (int, 可选) - 用于推理的 rank 数量。默认值:
1。npu_device_ids (list[int], 可选) - 从 MindIE 配置中获取的 NPU 设备 ID 列表。默认值:
None。plugin_params (str, 可选) - 包含额外插件参数的 JSON 字符串。默认值:
None。
- 返回:
MindIEModelRunner 实例。
样例:
>>> from mindformers import ModelRunner >>> model_path = /path/to/model/ # contains model config file and tokenizer file. >>> npu_mem_size = 3 >>> cpu_mem_size = 1 >>> block_size = 128 >>> rank_id = 0 >>> world_size = 1 >>> npu_device_ids = [0] >>> model_runner = ModelRunner(model_path=model_path, npu_mem_size=npu_mem_size, cpu_mem_size=cpu_mem_size, >>> block_size=block_size, rank_id=rank_id, world_size=world_size, >>> npu_device_ids=npu_device_ids) >>> type(model_runner) <class 'mindformers.model_runner.MindIEModelRunner'>