Release Notes

vLLM-MindSpore插件 0.3.0 Release Notes

以下为vLLM-MindSpore插件0.3.0版本支持的关键新功能和模型。

新特性

  • 0.9.1 V1架构基础功能, 包含分块预填充和自动前缀缓存功能;

  • V0 多步调度功能;

  • V0 分块预填充功能;

  • V0 自动前缀缓存功;

  • V0 DeepSeek MTP功能;

  • GPTQ量化;

  • SmoothQuant量化;

  • V1 后处理增强。

新模型

  • DeepSeek-V3/R1

  • Qwen2.5-0.5B/1.5/7B/14B/32B/72B

  • Qwen3-0.6B/1.7B/4B/8B/14B/32B