Release Notes

查看源文件

MindSpore 2.7.0-rc1 Release Notes

主要特性及增强

Ascend

  • [STABLE] 新增 O1 场景下的 GroupedMatmul 优化,支持该算子后融合 element-wise 算子,大幅减少数据搬运开销,提升计算效率。用户可以通过设置环境变量 MS_DEV_GRAPH_KERNEL_FLAGS"--enable_cluster_ops=GroupedMatmul"开启。

  • [STABLE] 提升内存 tracker 易用性:用户可以通过 mindspore.runtime.memory_replay(file_path) 导入 tracker 数据,用于模型显存分析;通过设置 export MS_ALLOC_CONF=memory_tracker_path:file_path 设置 tracker 数据保存路径;通过设置 export MS_ALLOC_CONF=simple_tracker:true 仅保存每个内存块最后一个使用者,减少保存数据大小。

  • [STABLE] 优化了图模式下ops.Custom原语针对aclnn类型的自定义算子功能,全面支持非Tensor类型输入,并自动加载RegInfo信息,显著提升了aclnn自定义算子的易用性和灵活性。

PyNative

并行

训练

  • [STABLE] 重计算通信掩盖:支持对于完全重计算的两个Cell的计算通信进行互相掩盖,提升重计算场景模型的性能。

  • [STABLE] 精度故障不重启快速恢复:支持当发生精度故障时,在不重启进程的情况下加载CheckPoint继续训练。

  • [STABLE] 静默检测:支持对正反向计算中 MatMul结果进行校验。用户可以通过设置环境变量 MS_SDC_DETECT_ENABLE1 使能,并通过 mindspore.utils.sdc_detect 模块的接口动态开启/关闭检测并获取结果。

推理

  • [STABLE] vLLM MindSpore 插件现已适配 vLLM v0.8.3 版本,并支持 vLLM V1 新架构的基础特性,包含 Chunked Prefill、Automatic Prefix Caching 等推理能力,在服务化部署方面,新增支持运行 DeepSeek-V3/R1 DP/TP/EP 混合并行推理能力,有效提升模型全量及增量推理效率,同时降低显存开销;

工具

自2.3版本起MindInsight工具停止更新发布,相关文档已下架。原有系统调优数据可视化已整合至MindStudio Insight,标量可视化、参数分布图可视化和计算图可视化已整合至MindStudio Insight插件,请参阅《MindStudio Insight用户指南》

  • [STABLE] MindSpore Profiler支持接入msMonitor功能,支持用户通过在线监控工具采集性能数据。

  • [STABLE] MindSpore Profiler增加record_shapes参数,支持用户采集框架侧下发算子的shape信息。

  • [STABLE] MindSpore Profiler增加sys类资源类开关,支持sys资源类信息采集能力。

  • [STABLE] MindSpore Profiler增加host_sys开关,支持系统调用类、存储类、cpu信息等host信息采集能力。

  • [STABLE] MindSpore Profiler mstx模块提供domain功能,支持用户精细化控制mstx打点数据。

API 变更

  • [STABLE] mindspore.mint API中部分DEMO状态的functional、nn和Tensor接口转为STABLE。mint接口当前大多仍为实验性接口,在图编译模式为O0/O1和PyNative模式下性能比ops更优。当前暂不支持O2编译模式(图下沉)及CPU、GPU后端,后续会逐步完善。

    mindspore.mint

    mindspore.mint.randomperm

    mindspore.mint.randn

    mindspore.mint.randint

    mindspore.mint.triu

    mindspore.mint.empty_like

    mindspore.mint.empty

    mindspore.mint.floor_divide

    mindspore.mint.nn

    mindspore.mint.nn.BatchNorm1d

    mindspore.mint.nn.BatchNorm2d

    mindspore.mint.nn.BatchNorm3d

    mindspore.mint.nn.PixelShuffle

    mindspore.mint.nn.Threshold

    mindspore.mint.nn.functional

    mindspore.mint.nn.functional.threshold

    mindspore.mint.nn.functional.threshold_

    mindspore.mint.nn.functional.pixel_shuffle

    mindspore.Tensor

    mindspore.Tensor.new_full

    mindspore.Tensor.new_empty

    mindspore.Tensor.floor_divide

    mindspore.Tensor.exponential_

  • [STABLE] mindspore.ops API新增mindspore.ops.swiglu接口,当前仅支持Ascend后端。

  • [STABLE] mindspore.ops API的mindspore.ops.svd接口现在额外支持了Ascend后端。

  • [STABLE] mindspore.mint.nn.functional.silumindspore.mint.nn.SiLU 新增支持了入参 inplace

  • [STABLE] communication.create_group 新增支持通信域额外配置 options。HCCL后端支持设置 options中的 hccl_config,针对通信域设置HCCL通信域缓存大小。

  • [STABLE] mindspore.runtime增加mindspore.runtime.empty_cache的实现。

  • [STABLE] mindspore.runtime.set_memory接口新增入参 huge_page_reserve_size

  • [STABLE] mindspore.runtime.set_cpu_affinity接口新增入参 module_to_cpu_dict

  • [STABLE] minspore.nn.Cell模块新增查看/保存模型状态的功能。新增接口:

    mindspore.nn.Cell

    cell.register_state_dict_post_hook

    cell.register_state_dict_pre_hook

    cell.state_dict

    cell.register_load_state_dict_pre_hook

    cell.register_load_state_dict_post_hook

    cell.load_state_dict

  • [STABLE] minspore.nn.Cell模块查看/注册模型缓冲区的功能。新增接口:

    mindspore.nn.Cell

    cell.register_buffer

    cell.get_buffer

    cell.get_sub_cell

    cell.named_buffer

    cell.buffers

非兼容性接口变更

  • runtime.set_cpu_affinity

    参数 affinity_cpu_list类型由字典变更为列表,仅针对单一进程自定义配置亲和CPU范围段。新增参数 module_to_cpu_dict,支持针对热点模块线程自定义配置CPU亲和策略。

    2.6

    2.7

    >>> from mindspore.runtime import set_cpu_affinity
    >>> set_cpu_affinity(True, {"device0": ["10-19", "23-40"]})

    >>> from mindspore.runtime import set_cpu_affinity
    >>> set_cpu_affinity(True, ["10-19", "23-40"],
    …                                {"main": [0,1,2,3],
    …                                 "runtime": [4,5,6],
    …                                 "pynative": [7,8,9]})

贡献者

baochong,Bellatan,BJ-WANG,caifubi,caiji_zhang,Carey,chaijinwei,changzherui,chengbin,chujinjin,DavidFFFan,DeshiChen,dingjinshan,Dring,ehaleva,Erpim,fary86,fengtingyan,fengyixing,fuchao,gaoyong10,gengdongjie,guangpengz,GuoZhibin,gupengcheng0401,haozhang,hedongdong,hhz886,huandong1,huangbingjian,huangziling,huda,HuilanLi,hujiahui8,jiangchao_j,jianghui58,jiangshanfeng,jiaorui,jiaxueyu,jizewei,jjfeing,jshawjc,kairui_kou,kingxian,kisnwang,lanzhineng,leida,LiangZhibo,lichen,limingqi107,LiNuohang,linux,liubuyu,liuchengji,liuluobin,liuyanwei,lkp,looop5,lujiale,luochao60,luoyang,maoyuanpeng1,Margaret_wangrui,mengxian,MengXiangyu,mengyuanli,NaCN,One_East,panshaowu,panzhihui,pengqi,Qiao_Fu,qiuleilei,qiuyufeng,rainyhorse,SaiYao,shaoshengqi,shen_haochen,shenhaojing,shenwei41,shuqian0,tanghuikang,tangmengcheng,tan-wei-cheng,tianxiaodong,uuhuu,wang_ziqi,WangChengzhao,wangshaocong,wangyibo,wujueying,XianglongZeng,xiaopeng,xiaotianci,xiaoyao,XinDu,xuzhen,yangguodong,yanghaoran,yangyingchun,Yanzhi_YI,yide12,yihangchen,YijieChen,yuanqi,yuchaojie,yuezenglin,YuJianfeng,YukioZzz,yuliangbin,yyuse,zhangbuxue,zhangdanyang,zhanghanLeo,zhangyinxia,ZhangZGC,zhanzhan,zhaochenjie,zhengzuohe,zhouyaqiang0,zhunaipan,zichun_ye,ZPaC,zyli2020,程超,范吉斌,胡犇,胡彬,宦晓玲,黄勇,李栋,李良灿,李林杰,李寅杰3,刘飞扬,刘力力,刘勇琪,刘子涵,梅飞要,宋佳琪,王泓皓,王禹程,王振邦,熊攀,徐安越,杨卉,杨明海,俞涵,虞良斌,云骑士,张栩浩,周一航