模型支持列表
模型 |
状态 |
支持后端 |
支持硬件 |
模型下载链接 |
|---|---|---|---|---|
DeepSeek-V3 |
已支持 |
MindFormers |
Atlas 800I A2 |
|
DeepSeek-R1 |
已支持 |
MindFormers |
Atlas 800I A2 |
|
DeepSeek-R1 W8A8 |
已支持 |
MindFormers |
Atlas 800I A2 |
|
DeepSeek-R1 W8A4 |
已支持 |
MindFormers |
Atlas 800I A2 |
|
Telechat2 |
已支持 |
MindFormers |
Atlas 800I A2 |
|
GLM-4.5 |
已支持 |
MindFormers |
Atlas 800I A2 |
|
GLM-4.1V-Thinking |
已支持 |
Native |
Atlas 800I A2 |
|
GLM-4 |
已支持 |
MindFormers |
Atlas 800I A2 |
|
Qwen3-VL |
已支持 |
Native |
Atlas 800I A2 |
[ |
Qwen3-VL-2B](https://huggingface.co/Qwen/Qwen3-VL-2B-Instruct)、Qwen3-VL-4B、Qwen3-VL-8B、Qwen3-VL-30B-A3B、Qwen3-VL-235B-A22B |
||||
Qwen3 |
已支持 |
Native, MindFormers |
Atlas 800I A2, Atlas 300I Duo |
|
Qwen3-235B-A22B |
已支持 |
Native, MindFormers |
Atlas 800I A2 |
|
Qwen3-30B-A3B |
测试中 |
Native, MindFormers |
Atlas 800I A2 |
|
Qwen2.5-VL |
已支持 |
Native |
Atlas 800I A2 |
Qwen2.5-VL-3B-Instruct、Qwen2.5-VL-7B-Instruct、Qwen2.5-VL-32B-Instruct、Qwen2.5-VL-72B-Instruct |
Qwen2.5 |
已支持 |
Native, MindFormers |
Atlas 800I A2, Atlas 300I Duo(测试中) |
Qwen2.5-0.5B-Instruct、Qwen2.5-1.5B-Instruct、Qwen2.5-3B-Instruct、 Qwen2.5-7B-Instruct、Qwen2.5-14B-Instruct、Qwen2.5-32B-Instruct、Qwen2.5-72B-Instruct |
QwQ-32B |
测试中 |
Native, MindFormers |
Atlas 800I A2 |
|
Llama3.1 |
测试中 |
Native |
Atlas 800I A2 |
Llama-3.1-8B-Instruct、Llama-3.1-70B-Instruct、Llama-3.1-405B-Instruct |
Llama3.2 |
测试中 |
Native |
Atlas 800I A2 |
模型说明
用户可参考环境变量章节,通过环境变量
VLLM_MS_MODEL_BACKEND,指定模型后端;原生模型后端当前支持Qwen2.5、Qwen2.5VL、Qwen3、Llama系列模型;MindSpore Transformers模型后端支持Qwen系列、DeepSeek、TeleChat、GLM系列模型;
300I Duo已支持Qwen3模型,其余模型适配中。