vLLM-MindSpore Plugin

快速开始

  • 快速体验
  • 安装指南
  • 单卡推理(Qwen2.5-7B)
  • 多卡推理(Qwen2.5-32B)
  • 多机并行推理(DeepSeek R1)

使用指南

  • 模型支持列表
  • 特性支持列表
  • 量化方法
  • 调试方法
  • 性能测试
  • 环境变量清单

开发者指南

  • 自定义算子接入
  • 贡献指南

安全

  • 安全

FAQ

  • 常见问题

RELEASE NOTES

  • Release Notes
vLLM-MindSpore Plugin
  • »
  • 搜索


© 版权所有 MindSpore.

利用 Sphinx 构建,使用了 主题 由 Read the Docs开发.