lite_boost.parallel.initialize_usp
- lite_boost.parallel.initialize_usp()[源代码]
初始化并行推理所需的HCCL分布式环境。
该函数配置NPU运行时设置,并通过读取以下环境变量初始化HCCL分布式进程组:
RANK- 当前进程的本地rank,默认值0。WORLD_SIZE- 分布式进程总数,默认值1。MASTER_ADDR- 主节点IP地址,默认值"127.0.0.1"。MASTER_PORT- 主节点端口,默认值29502。NUM_THREADS- 每个进程的CPU线程数,默认值24。
若分布式进程组尚未初始化,该函数将使用
hccl后端进行初始化。初始化完成后,将RANK对应的NPU设备设置为当前活跃设备。说明
该函数必须在构造
ParallelManager之前调用,通常在分布式训练或推理脚本的入口处执行。- 异常:
RuntimeError - HCCL进程组初始化失败时抛出。
样例:
>>> import os >>> os.environ["RANK"] = "0" >>> os.environ["WORLD_SIZE"] = "1" >>> from lite_boost.parallel import initialize_usp >>> initialize_usp()