Release Notes

MindSpore Lite 2.8.0 Release Notes

主要特性及增强

  • MindSpore Lite支持Python3.12。

  • MindSpore Lite支持保存转换过程的中间图,可以使用环境变量控制模型转换时是否保存中间图,用于转换时问题定位。

云侧推理

  • LoRA权重更新性能优化,调用Model.UpdateWeights()接口性能从秒级优化至百毫秒级。

  • MindSpore Lite Ascend后端ACL推理支持TimeOut配置。

  • MindSpore Lite 云侧推理支持模型并发加载。

  • MindSpore Lite Ascend后端GE推理支持静态shape、动态分档下数据零拷贝。

端侧推理

  • MindSpore Lite支持Android NPU离线模型推理。

  • MindSpore Lite移除数据预处理MindData模块。

  • MindSpore Lite移除Micro对Cortex-m CMSIS的支持。

API 变更

  • LoRA权重更新转换配置变更,variable_weights_file内容格式由

    weight_name:(shape);node_name
    

    修改为

    weight_name:shape;node_name
    
  • 环境变量新增保存转换过程中间图功能:

    当用户配置export MSLITE_DUMP_LEVEL=0 表示Dump详细的图结构,以及常量Tensor数据;
    当用户配置export MSLITE_DUMP_LEVEL=1 表示仅Dump图结构,不dump常量Tensor数据。
    当用户配置export MSLITE_DUMP_PATH="/xx/xx/" 表示dump graph的路径。
    
  • 移除端侧训练Train()/Evaluate()高阶接口,可通过RunStep()低阶接口替代。

  • MindSpore Lite 云侧推理新增c++接口Model.Build以及python接口Model.build_from_buffer接口,用于支持权重分离下基于buffer加载模型。

贡献者

YeFeng_24,xiong-pan,jjfeing,liuf9,xu_anyue,yiguangzheng,zxx_xxz,jianghui58,hbhu_bin,chenyihang5,qll1998,yangyingchun1999,liuchengji3,cheng-chao23,gemini524,yangly