模型支持列表

查看源文件

模型

状态

模型下载链接

DeepSeek-V3

已支持

DeepSeek-V3

DeepSeek-R1

已支持

DeepSeek-R1

DeepSeek-R1 W8A8

已支持

Deepseek-R1-W8A8

Qwen2.5

已支持

Qwen2.5-0.5B-InstructQwen2.5-1.5B-InstructQwen2.5-3B-InstructQwen2.5-7B-InstructQwen2.5-14B-InstructQwen2.5-32B-InstructQwen2.5-72B-Instruct

Qwen3-32B

已支持

Qwen3-32B

Qwen3-235B-A22B

已支持

Qwen3-235B-A22B

Qwen3、Qwen3-MOE

测试中

Qwen3-0.6BQwen3-1.7BQwen3-4BQwen3-8BQwen3-14BQwen3-30B-A3

Qwen2.5-VL

测试中

Qwen2.5-VL-3B-InstructQwen2.5-VL-7B-InstructQwen2.5-VL-32B-InstructQwen2.5-VL-72B-Instruct

QwQ-32B

测试中

QwQ-32B

Llama3.1

测试中

Llama-3.1-8B-InstructLlama-3.1-70B-InstructLlama-3.1-405B-Instruct

Llama3.2

测试中

Llama-3.2-1B-InstructLlama-3.2-3B-Instruct

注:用户可参考环境变量章节,通过环境变量vLLM_MODEL_BACKEND,指定模型后端。