Release Notes

MindSpore Golden Stick 1.3.0 Release Notes

主要特性和增强

  • 新增 AutoQuantForCausalLMBaseQuantForCausalLM 类,提升对因果语言模型量化的易用性。主要改进包括:

    • 自动模型选择:根据预训练模型路径自动识别并实例化适当的量化模型实现,无需手动指定模型类型。

    • 标准化接口:通过 BaseQuantForCausalLM 基类定义标准接口,方便后续扩展和新模型适配。

    • 一键HuggingFace格式权重保存:支持直接保存为HuggingFace兼容的量化权重格式,简化模型部署流程。

  • OSL(OutlierSuppression-Lite)A8W8 量化技术新增对 MindSpore Transformers MCore 架构 DeepSeekV3/R1、QWen3 系列模型的支持。

  • 新增 A8W4 训练后量化算法,支持 MindSpore Transformers MCore 架构 DeepSeekV3/R1、QWen3 系列模型。

  • [Demo] 新增 FAQuant 训练后量化算法,支持 MindSpore Transformers MCore 架构 DeepSeekV3/R1 模型。

API变更

  • 新增 mindspore_gs.ptq.AutoQuantForCausalLM 类:自动模型量化类,根据预训练模型路径自动选择合适的量化模型实现。

  • 新增 mindspore_gs.ptq.BaseQuantForCausalLM 类:因果语言模型量化基类,定义了量化模型的标准接口。提供了所有派生类必须实现的基本结构和必需方法,包括 from_pretrainedcalibrateforwardsave_quantized 等核心方法。

贡献者

感谢以下人员做出的贡献:

tongl, zhuxiaochen, guoguopot, ccsszz, yyyyrf, hangangqiang, HeadSnake

欢迎以任何形式对项目提供贡献!