模型支持列表

查看源文件

模型

状态

支持后端

支持硬件

模型下载链接

DeepSeek-V3

已支持

MindFormers

Atlas 800I A2

DeepSeek-V3

DeepSeek-R1

已支持

MindFormers

Atlas 800I A2

DeepSeek-R1

DeepSeek-R1 W8A8

已支持

MindFormers

Atlas 800I A2

DeepSeek-R1-W8A8

DeepSeek-R1 W8A4

已支持

MindFormers

Atlas 800I A2

DeepSeek-R1-W8A4

Telechat2

已支持

MindFormers

Atlas 800I A2

TeleChat2-7B-32KTeleChat2-35B-32K

GLM-4.5

已支持

MindFormers

Atlas 800I A2

GLM-4.5, GLM-4.5-Air

GLM-4.1V-Thinking

已支持

Native

Atlas 800I A2

GLM-4.1V-9B-Thinking

GLM-4

已支持

MindFormers

Atlas 800I A2

GLM-4-9B-0414GLM-4-32B-0414

Qwen3-VL

已支持

Native

Atlas 800I A2

[

Qwen3-VL-2B](https://huggingface.co/Qwen/Qwen3-VL-2B-Instruct)、Qwen3-VL-4BQwen3-VL-8BQwen3-VL-30B-A3BQwen3-VL-235B-A22B

Qwen3

已支持

Native, MindFormers

Atlas 800I A2, Atlas 300I Duo

Qwen3-0.6BQwen3-1.7BQwen3-4BQwen3-8BQwen3-14BQwen3-32B

Qwen3-235B-A22B

已支持

Native, MindFormers

Atlas 800I A2

Qwen3-235B-A22B

Qwen3-30B-A3B

测试中

Native, MindFormers

Atlas 800I A2

Qwen3-30B-A3B

Qwen2.5-VL

已支持

Native

Atlas 800I A2

Qwen2.5-VL-3B-InstructQwen2.5-VL-7B-InstructQwen2.5-VL-32B-InstructQwen2.5-VL-72B-Instruct

Qwen2.5

已支持

Native, MindFormers

Atlas 800I A2, Atlas 300I Duo(测试中)

Qwen2.5-0.5B-InstructQwen2.5-1.5B-InstructQwen2.5-3B-InstructQwen2.5-7B-InstructQwen2.5-14B-InstructQwen2.5-32B-InstructQwen2.5-72B-Instruct

QwQ-32B

测试中

Native, MindFormers

Atlas 800I A2

QwQ-32B

Llama3.1

测试中

Native

Atlas 800I A2

Llama-3.1-8B-InstructLlama-3.1-70B-InstructLlama-3.1-405B-Instruct

Llama3.2

测试中

Native

Atlas 800I A2

Llama-3.2-1B-InstructLlama-3.2-3B-Instruct

模型说明

  1. 用户可参考环境变量章节,通过环境变量VLLM_MS_MODEL_BACKEND,指定模型后端;

  2. 原生模型后端当前支持Qwen2.5、Qwen2.5VL、Qwen3、Llama系列模型;MindSpore Transformers模型后端支持Qwen系列、DeepSeek、TeleChat、GLM系列模型;

  3. 300I Duo已支持Qwen3模型,其余模型适配中。