常见问题

安装相关问题

源码安装时报错`ModuleNotFoundError: No module named 'mindspore'`

错误关键信息：

在执行以下命令安装vLLM-MindSpore Plugin

git clone https://atomgit.com/mindspore/vllm-mindspore.git
cd vllm-mindspore
bash install_depend_pkgs.sh
pip install .

得到如下报错信息

ModuleNotFoundError: No module named 'mindspore'

解决思路：
1. 请检查是否已正确安装MindSpore。如果未安装，请参考MindSpore安装指南，或参考安装指南进行安装，确认bash install_depend_pkgs.sh已执行成功。
2. 请检查pip版本是否大于等于25.3。如果是，则使用以下命令编译并安装vLLM-MindSpore Plugin：
```
git clone https://atomgit.com/mindspore/vllm-mindspore.git
cd vllm-mindspore
bash install_depend_pkgs.sh
pip install --no-build-isolation .
```

模型相关问题

git-lfs安装

请到以下链接获取对应的git-lfs安装包。

下载并安装：

mkdir git-lfs
cd git-lfs
wget https://github.com/git-lfs/git-lfs/releases/download/v3.0.1/git-lfs-linux-arm64-v3.0.1.tar.gz --no-check-certificate
tar zxvf git-lfs-linux-arm64-v3.0.1.tar.gz
bash install.sh

校验是否安装成功：
```
git lfs install
```
若返回 Git LFS initialized.，则已安装成功。

部署相关问题

拉起在线推理时，报`aclnnNonzeroV2`相关错误

错误关键信息：

RuntimeError: Call aclnnNonzeroV2 failed, detail:E39999: Inner Error

解决思路：

请检查CANN与MindSpore的配套关系是否正确。

`import vllm_mindspore`时找不到`torch`

错误关键信息：

importlib.metadata.PackageNotFoundError: No package metadata was found for torch

解决思路：

vLLM-MindSpore插件相关依赖未完整安装，如缺少torch、MSAdapter等组件。请参考安装指南进行安装。

推理时报`vllm._C`相关的告警

告警关键信息：

Failed to import from vllm._C with ModuleNotFoundError("No module named 'vllm._C'")

说明：该告警为非影响推理的告警，不影响模型的离线推理。

推理过程中报内存不足相关的问题

错误关键信息：出现关键信息Out of Memory，或出现Allocate memory failed，则为设备内存不足的问题。
解决思路：该报错表示设备内存不足，可能由多种原因导致，建议按以下方面排查：
1. 使用命令npu-smi info，确认卡是否独占状态。若不是独占状态，可尝试将卡设置为独占状态。
2. 确认模型参数是否过大，导致内存不足。若模型参数过大，可尝试减少模型参数，或使用分布式推理。
3. 若使用在线推理，可以调整--max-model-len参数，减少模型最大长度，减少内存占用；或提高--gpu-memory-utilization，从而提高显存利用率。
4. 若使用离线推理，可以在初始化LLM对象时，对max_model_len参数进行设置，减少模型最大长度；或对gpu_memory_utilization参数进行提高，增加显存使用率。
5. 调整混合并行策略，适当增大流水线并行（pp）和模型并行（mp），并相应减小数据并行（dp），保持dp * mp * pp = device_num，必要时增加NPU数量。

常见问题

安装相关问题

源码安装时报错ModuleNotFoundError: No module named 'mindspore'

模型相关问题

git-lfs安装

部署相关问题

拉起在线推理时，报aclnnNonzeroV2相关错误

import vllm_mindspore时找不到torch

推理时报vllm._C相关的告警

推理过程中报内存不足相关的问题

源码安装时报错`ModuleNotFoundError: No module named 'mindspore'`

拉起在线推理时，报`aclnnNonzeroV2`相关错误

`import vllm_mindspore`时找不到`torch`

推理时报`vllm._C`相关的告警