环境变量清单
环境变量 |
功能 |
类型 |
取值 |
说明 |
---|---|---|---|---|
|
用于指定模型后端。使用vLLM-MindSpore插件原生模型后端时无需指定;使用模型为vLLM-MindSpore插件外部后端时则需要指定。 |
String |
|
原生模型后端当前支持Qwen2.5系列;MindSpore Transformers模型后端支持Qwen系列、DeepSeek、Llama系列模型,使用时需配置环境变量: |
|
MindSpore Transformers模型的配置文件。使用Qwen2.5系列、DeepSeek系列模型时,需要配置文件路径。 |
String |
模型配置文件路径。 |
该环境变量在后续版本会被移除。 样例: |
|
用于多机之间使用gloo通信时的网口名称。 |
String |
网口名称,例如enp189s0f0。 |
多机场景使用,可通过 |
|
用于多机之间使用TP通信时的网口名称。 |
String |
网口名称,例如enp189s0f0。 |
多机场景使用,可通过 |
|
用于多机之间使用HCCL通信时的网口名称。 |
String |
网口名称,例如enp189s0f0。 |
多机场景使用,可通过 |
|
指定哪些Device对当前进程可见,支持一次指定一个或多个Device ID。 |
String |
为Device ID,逗号分割的字符串,例如"0,1,2,3,4,5,6,7"。 |
ray使用场景建议使用。 |
|
此环境变量用于控制两个NPU之间共享数据的缓存区大小。 |
Integer |
缓存区大小,大小为MB。例如: |
使用方法参考:HCCL_BUFFSIZE。例如DeepSeek 混合并行(数据并行数为32,专家并行数为32),且 |
|
设置PyNative模式下设备内存池的块大小。 |
String |
正整数string,单位为GB。 |
|
|
是否使用昇腾 |
String |
|
取值为 |
|
开启profiling采集数据,当配置了采集数据保存路径后生效 |
String |
Profiling数据保存路径。 |
更多的环境变量信息,请查看: