环境变量清单

查看源文件

环境变量

功能

类型

取值

说明

VLLM_MS_MODEL_BACKEND

用于指定模型后端。如果不配置变量,会按照 MindFormers > 原生模型 > MindONE 的优先级自动寻找支持的后端。配置之后则按指定后端执行。

String

MindFormers: 模型后端为MindSpore Transformers。 Native: 模型后端为原生模型。 MindONE: 模型后端为MindONE

原生模型后端当前支持Qwen2.5、Qwen2.5VL、Qwen3、Llama系列;MindSpore Transformers模型后端支持Qwen系列、DeepSeek、TeleChat系列模型。

GLOO_SOCKET_IFNAME

用于多机之间使用gloo通信时的网口名称。

String

网口名称,例如enp189s0f0。

多机场景使用,可通过ifconfig查找IP对应网卡的网卡名。

TP_SOCKET_IFNAME

用于多机之间使用TP通信时的网口名称。

String

网口名称,例如enp189s0f0。

多机场景使用,可通过ifconfig查找IP对应网卡的网卡名。

HCCL_SOCKET_IFNAME

用于多机之间使用HCCL通信时的网口名称。

String

网口名称,例如enp189s0f0。

多机场景使用,可通过ifconfig查找IP对应网卡的网卡名。

ASCEND_RT_VISIBLE_DEVICES

指定哪些Device对当前进程可见,支持一次指定一个或多个Device ID。

String

为Device ID,逗号分割的字符串,例如"0,1,2,3,4,5,6,7"。

ray使用场景建议使用。

HCCL_BUFFSIZE

此环境变量用于控制两个NPU之间共享数据的缓存区大小。

Integer

缓存区大小,单位为MB。例如:2048

使用方法参考:HCCL_BUFFSIZE。例如DeepSeek 混合并行(数据并行数为32,专家并行数为32),且max-num-batched-tokens为256时,则export HCCL_BUFFSIZE=2048

MS_MEMPOOL_BLOCK_SIZE

设置PyNative模式下设备内存池的块大小。

String

正整数string,单位为GB。

vLLM_USE_NPU_ADV_STEP_FLASH_OP

是否使用昇腾adv_step_flash算子。

String

on: 使用;off:不使用

取值为off时,将使用小算子实现替代adv_step_flash算子。

VLLM_TORCH_PROFILER_DIR

开启profiling采集数据,当配置了采集数据保存路径后生效。

String

Profiling数据保存路径。

更多的环境变量信息,请查看: