0day同步!昇思MindSpore首发支持智谱GLM-4.1V-9B-Thinking多模态模型
0day同步!昇思MindSpore首发支持智谱GLM-4.1V-9B-Thinking多模态模型
7月2日,智谱AI发布视觉语言大模型GLM-4.1V-9B-Thinking,昇思MindSpore在开源当日即实现0day支持。昇思MindSpore通过提供主流生态接口,依托MindSpore One套件,小时级完成模型无缝迁移,并将版本上传至开源社区,欢迎广大开发者下载体验!
MindSpore One代码仓:
https://github.com/mindspore-lab/mindone
体验指导链接:
https://modelers.cn/models/MindSpore-Lab/GLM-4.1V-9B-Thinking
# 01
模型介绍
视觉语言大模型(VLM)已经成为智能系统的关键基石。随着真实世界的智能任务越来越复杂,VLM模型也亟需在基本的多模态感知之外, 逐渐增强复杂任务中的推理能力,提升自身的准确性、全面性和智能化程度,使得复杂问题解决、长上下文理解、多模态智能体等智能任务成为可能。
基于 GLM-4-9B-0414 基座模型,新版VLM开源模型 GLM-4.1V-9B-Thinking 引入思考范式,通过课程采样强化学习 RLCS(Reinforcement Learning with Curriculum Sampling)全面提升模型能力, 达到 10B 参数级别的视觉语言模型的最强性能,在18个榜单任务中持平甚至超过8倍参数量的 Qwen-2.5-VL-72B。
# 02
环境要求
- mindspore 2.5.0/2.6.0
- ascend driver 24.1.RC3.b080
- firmware 7.5.T11.0.B088
- cann tookit/kernel 8.0.RC3.beta1
# 03
权重下载
下载权重到/home/GLM-4.1V,需要预留至少21GB空间,可以根据需要调整路径。
pip install openmind_hub
export HUB_WHITE_LIST_PATHS=/home/GLM-4.1V
python
from openmind_hub import snapshot_download
snapshot_download(
repo_id="MindSpore-Lab/GLM-4.1V-9B-Thinking",
local_dir="/home/GLM-4.1V",
local_dir_use_symlinks=False
)
# 04
环境准备
安装最新的MinSpore One以及Transformers,/home路径根据需要调整。
cd /home
git clone https://github.com/mindspore-lab/mindone.git --depth 1
若执行失败,可以尝试:
git clone https://gh-proxy.com/github.com/mindspore-lab/mindone.git --depth 1
之后执行:
cd mindone
pip install -e .
安装transformers(安装过程中忽略报错信息):
pip install transformers==4.53.0
# 05
执行推理测试
参数model_name指的是本地下载的权重,根据需要调整。image指的是本地存储的图片,需要更改。
默认推理token数是128,如果需要更多可以修改/home/mindone/examples/transformers/glm4v/generate.py中的max_new_tokens=128改成2048。
若想要输出英文,则输入英文(推荐)
cd /home/mindone/examples/transformers/glm4v
python generate.py --model_name /home/GLM-4.1V --image /home/trial.jpg --prompt "Describe this image."
若想要输出中文,则输入中文:
cd /home/mindone/examples/transformers/glm4v
python generate.py --model_name /home/GLM-4.1V --image /home/trial.jpg --prompt "请帮我描述这张图片。"
昇思MindSpore AI框架将持续支持更多业界主流模型,欢迎大家试用并在昇思论坛提供宝贵的反馈意见。(https://discuss.mindspore.cn/)
MindSpore Transformers SIG首次月例会将在7月3日16:00举办,欢迎感兴趣的开发者参与:https://meeting.tencent.com/dm/olkrpDKfadmJ