社区月报 | 昇思MindSpore 2.6版本重磅发布、Qwen3、GLM4等主流模型0Day同步首发!
社区月报 | 昇思MindSpore 2.6版本重磅发布、Qwen3、GLM4等主流模型0Day同步首发!
昇思MindSpore2025年4月份总结
一、概述
2025年4月,昇思MindSpore开源社区持续保持着高速发展的态度,在技术创新、社区运作等方面都取得了显著的成果。
社区同步首发Qwen3,支持一键部署、0Day支持智谱开源GLM-4-0414系列模型并上线MindSpore社区,GLM4涵盖32B和9B规格,推理速度高达200 Tokens/秒,进一步丰富了开源模型生态。上海交通大学联合MindSpore与openEuler社区,成功实现DeepSeek全栈开源单机推理部署,在量化精度无损的条件下显著提升推理性能。
昇思开发者大会(MindSpore Developer Day 2025)成功举办,正式发布MindSpore 2.6版本,该版本全面支持DeepSeek V3/R1 MoE模型训练推理全流程,并推出强化学习套件,显著提升模型迁移效率。
在创新应用方面,中国科学技术大学团队提出了一种名为ChemAgents的多智能体系统,结合了LLM和自动化机器人技术,能够自主执行复杂的化学实验,极大地减少了人为干预。该研究使用的是基于昇思MindSpore的Llama-3.1-70B模型,目前已昇思MindSpore社区开源。
华为阔折叠屏手机Pura X搭载全新小艺助手,全新小艺基于昇思MindSpore,语音合成性能提升30%,AI人像修图效率倍增,带来更拟人化的自然语音交互体验。翔迅科技则基于昇腾和MindSpore推出DeepSeek智能办公大模型,推动行业智能化转型。
在社区活动方面,昇思MindSpore社区通过创新应用挑战、华为ICT大赛、开源实习计划、量子计算黑客松大赛等活动推动AI技术在不同场景中的深度应用,助力开发者成长。值得一提的是,在第九届华为ICT大赛中,基于MindSpore开发的创新项目表现亮眼,斩获半数一等奖,展现了社区开发者的技术实力。在开发者培养方面,昇思MindSpore开源实习项目启动,在校学生可通过完成实际任务获得积分和实习证明。高校合作方面,昇思大模型创新应用与工程实践师资培训成功举办,吸引了全国32所高校教师参与,推动AI技术在教学中的创新应用。
以下是4月昇思MindSpore社区进展的详细报告。
二、社区规模
截至4月底,昇思MindSpore面向全球开发者,凝聚产业力量,持续打造人工智能创新之源。社区秉持开放透明原则,稳步建设开源生态,规模和活跃度得到持续提升。
社区发展了**4.6万+**核心贡献者;
累计产生ISSUE共41.6****K、PR共110.5K。
三、社区大事件
**1、**昇思开发者大会成功举办,MindSpore 2.6版本重磅发布
2025年4月12日,昇思开发者大会(MindSpore Developer Day 2025)顺利召开,吸引了超过300位开发者现场深度参与。会上,昇思MindSpore 2.6版本正式发布。该版本全面支持类DeepSeek V3/R1 MoE模型训练推理全流程,推出训推一体的强化学习套件使能后训练范式创新,易用性上实现主流SOTA模型的Day0迁移。
在SIG Gathering环节,开发者们围绕《MindSpore MOE专家大模型预训练技术研讨》、《MindSpore强化学习、蒸馏与R1复现技术研讨》、《MindSpore加速DeepSeek大模型推理研讨》、《MindSpore开发体验与易用性提升》、《MindSpore Science:加速AI4Science创新与落地》五大专题展开深入探讨与交流,推动昇思MindSpore的技术发展与应用。

2、同****步首发!智谱开源GLM-4-0414系列6个模型上线昇思MindSpore
4月15日,智谱全新开源的GLM-4-0414 32B/9B模型上线昇思MindSpore开源社区,并完成精度测试。
智谱GLM-4-0414拥有 32B/9B两个尺寸,涵盖基座、推理、沉思模型,均遵循 MIT 许可协议。其中,推理模型 GLM-Z1-32B-0414 性能媲美 DeepSeek-R1 等顶尖模型,实测推理速度可达 200 Tokens/秒。
基座模型 GLM-4-32B-0414 拥有 320 亿参数,其性能可与国内、外参数量更大的主流模型相媲美。该模型利用 15T 高质量数据进行预训练,特别纳入了丰富的推理类合成数据,为后续的强化学习扩展奠定了基础。在后训练阶段,除了进行面向对话场景的人类偏好对齐,还通过拒绝采样和强化学习等技术,重点增强模型在指令遵循、工程代码生成、函数调用等任务上的表现,以强化智能体任务所需的原子能力。
昇思MindSpore开源社区训练代码:
https://gitee.com/mindspore/mindformers/tree/dev/research/deepseek3
魔乐社区推理代码:
https://modelers.cn/models/MindSpore-Lab/DeepSeek-V3

**3、**上海交通大学联合MindSpore与openEuler社区,实现DeepSeek全栈开源单机推理部署
上海交通大学并行与分布式系统研究所联合昇思MindSpore社区、openEuler社区,联合开发验证了基于vLLM+openEuler+MindSpore、全栈开源的DeepSeek推理解决方案。双方研发人员协同完成DeepSeek-R1/V3-0324权重参数的Int4量化,在精度几乎无损的条件下,实现单台Atlas 800T A2服务器(64GB)部署运行DeepSeek大模型推理服务。同时,验证了DeepSeek-R1/V3-0324 Int8量化推理,其系统总吞吐性能较前序版本提升幅度达15%。

**4、**0 Day支持!昇思MindSpore同步首发Qwen3,支持一键部署
Qwen3是阿里云于2025年4月29日发布并开源的全新模型,作为Qwen系列中的最新一代大语言模型,提供了一系列密集型和混合专家(MoE)模型。本次Qwen发布多个尺寸模型,覆盖235B/32B/30B/14B/8B/4B/1.7B/0.6B。昇思MindSpore基于对Qwen2.5的支持与兼容主流生态的接口,快速实现Qwen3的0Day支持,并将MindSpore版Qwen3代码上传至开源社区代码仓,面向开发者提供开箱即用的模型。

**5、**昇思开源社区携手鹏城实验室荣获第四届中国国际软件发展大会突破性技术成果奖
2025年4月24日,由中国软件行业协会主办的第四届中国国际软件发展大会在京召开。会上,昇思MindSpore AI框架全新发布的MindSpore 2.6版本、鹏城实验室发布的基于昇思MindSpore AI框架及昇腾AI硬件的强化学习训练框架GRPO-Training-Suite在本次大会上均荣获2024年软件行业突破性技术成果奖。


四、社区动态
1、创新应用挑战活动第一期开启报名
模力方舟携手昇腾与昇思MindSpore,重磅推出「昇腾赋能,智启未来」创新应用挑战!挑战活动第一期报名已正式开启,参与的应用将聚焦于学习效能提升与教育场景革新,基于昇腾与昇思MindSpore支持的模型开发具备实用价值与创新性的教育类应用。
欢迎使用昇思MindSpore模型参赛
模型链接:https://ai.gitee.com/serverless-api/packages/1495

2、第九届华为ICT大赛创新赛中国总决赛落幕,昇思开发者斩获半数一等奖
第九届华为ICT大赛中国总决赛颁奖典礼在东南大学圆满落下帷幕。本次决赛各赛道获奖名单在会上揭晓。在创新赛,昇思MindSpore开发者脱颖而出,占一等奖获奖队伍的50%,他们将晋级5月在深圳举办的全球总决赛,与来自世界其他国家的队伍展开巅峰对决。

**3、**第七届·2025 MindSpore量子计算黑客松全国大赛火热进行中
由昇思MindSpore社区主办的年度量子计算黑客松全国大赛正在火热进行中,诚邀您报名。无论您是初学小白,还是技术达人,参赛即有收获,欢迎参赛。
活动报名截止日期:5月20日
大赛报名链接:https://developer.huaweicloud.com/competition/information/1300000041

**4、**做任务攒积分,昇思MindSpore开源实习活动持续进行中
开源实习是由MindSpore社区、openEuler社区等多个社区共同发起的线上实习项目,旨在鼓励在校学生积极参与开源社区,在实际的开源环境中提升实践能力。昇思MindSpore社区将持续提供实习任务与导师辅导,学生通过实习申请后,可在社区领取任务,每完成一个任务可获得相应积分,积分累计达规定量后,可获得实习证明和实习工资。欢迎感兴趣的开发者参加。

**5、**2025年华为基础软件师资培训:昇思大模型创新应用与工程实践
2025年4月26-27日, 2025年华为基础软件-昇思大模型创新应用与工程实践师资培训在北京师范大学成功举办,本次培训吸引了32位来自全国多所高校计算机科学与技术、人工智能等相关专业的教师参与,共同探索大模型技术在教学与科研中的创新应用。

五、社区案例
**1、**昇思助力中科大团队打造多智能体驱动的机器人AI化学家
由中国科学技术大学罗毅、陈林江、张飞、尚伟伟、傅尧和江俊等组成的团队在《J. Am. Chem. Soc.》提出了一种名为ChemAgents的多智能体系统,结合了LLM和自动化机器人技术,能够自主执行复杂的化学实验,极大地减少了人为干预。通过多智能体的协作,ChemAgents不仅能够自主设计实验、执行实验,还能通过机器学习模型进行数据分析和优化,最终实现化学研究的全自动化。
据了解,该研究使用的是基于昇思MindSpore的Llama-3.1-70B模型,目前已昇思MindSpore社区开源。

**2、**算法性能倍增!昇思多维混合并行等技术助力小艺语音交互、AI修图体验升级
近期,华为发布阔折叠屏手机Pura X,并首发鸿蒙AI,搭载焕新升级的小艺助手,带来更拟人化的自然语音交互体验。全新小艺基于昇思MindSpore,实现小艺语音合成算法推理性能提升30%,AI人像精修算法推理性能倍增,提升用户对话体验的实时性与修图效率。

**3、**翔迅科技基于昇腾和昇思MindSpore打造翔迅大模型DeepSeek智能办公版,助力行业办公场景AI赋能
随着人工智能技术的极速发展,如何在复杂的办公场景中实现高效、精准的智能化应用,已成为业界关注的焦点。西安翔迅科技有限责任公司(简称“翔迅科技”),以多年的技术经验和强大的人工智能技术团队,在西安昇腾智能科技有限公司的AI算力支持下,基于昇腾AI硬件+昇思MindSpore AI框架,打造出“翔迅大模型DeepSeek智能办公版”。通过知识蒸馏、定制化微调、垂直领域知识库及大规模数据处理等技术,为办公场景提供了新的解决方案,助力行业办公数字化、智能化转型。

六、技术分享
**1、**快速支持DeepSeek-V3-0324,昇思MindSpore+vLLM服务化部署开源版本上线
近日,基于昇思 MindSpore AI 框架+vLLM的DeepSeek-V3-0324 模型完成适配并上线魔乐社区。
作为开源AI框架,MindSpore 以其卓越的性能优化、灵活的模型开发能力和高效的分布式训练能力,为大规模模型训推部署提供全流程开源支持。
原文阅读:
https://mp.weixin.qq.com/s/DfEc14anPJ6_vO_OPJNOdA
**2、**零样本声音克隆,基于昇腾+MindSpore玩转Spark-TTS
Spark-TTS 是一款基于大语言模型(LLM)技术的先进文本转语音系统,能够根据用户需求合成高准确度且自然流畅的定制化语音。MindSpore团队现已完成对Spark-TTS 的适配,并将其开源至MindSpore ONE仓库。
MindSpore ONE开源代码仓链接:
https://github.com/mindspore-lab/mindone/tree/master/examples/sparktts

**3、**晶体生成10倍加速!基于流模型的晶体结构生成模型CrystalFlow在昇思社区开源
理论晶体结构预测是通过计算的手段寻找物质在给定的外界条件下最稳定结构的重要手段。传统方法依赖势能面的随机采样与局域优化,计算成本高昂,尤其在多元素复杂体系中面临巨大挑战。CrystalFlow采用先进的流模型生成方案,有效地在未知的目标概率分布和已知的简单概率分布建立概率密度变换关系,以学习晶体结构数据库中合理的稳定结构特征,并生成新的合理构型。通过使用图等变消息传递网络,CrystalFlow有效处理了晶体结构内在的基本对称性,包括置换、旋转和周期平移不变性,实现对晶体结构的高效学习和建模,以及灵活的条件式生成策略。该模型在MP20等基准数据集上达到优秀的水平,目前已在昇思社区开源。
项目地址:
https://gitee.com/mindspore/mindscience/tree/master/MindChemistry

**4、**社区博客分享(4月)
2)源码精读之MindSpore如何实现Python侧和C++侧之间的链接
七、感谢每一位朋友、开发者的支持
在此感谢社区伙伴们、可爱的小孢子们以及昇思MindSpore SIG组成员们,因为大家的共同努力及辛勤奉献,昇思MindSpore才能不断成长与发展!同时我们对可能出现的不完善之处向您表示诚挚的歉意,并衷心感谢您的理解与支持。
未来,昇思MindSpore AI框架将持续致力于打造人工智能创新之源,凝聚产业力量,扎根AI根技术,使能大模型与科学智能,成为AI创新的首选框架。