Release Notes

MindSpore Transformers 1.8.0 Release Notes

以下为MindSpore Transformers套件1.8.0版本的变更日志,相较于1.7.0版本有以下关键新特性和bugfix。

新特性

Bugfix

在当前版本发布周期内,我们进行了模型/功能/易用性/文档等诸多方面的bugfix,在此列举部分关键修复内容:

  • !7824:修复Mcore网络中pad_token_id不生效问题。

  • !7818:修复部分环境下hostname获取失败问题。

  • !7793 !7713:修复Hugging Face数据集相关问题。

  • !7630:修复变换并行策略时safetensors权重转换加载问题。

  • !7743:修复共享专家大于1场景下hidden_size赋值逻辑。

  • !7790:修复q_lora_rank为None时,推理权重加载失败的问题。

  • !7902:修复DeepSeek-V3推理模型不加载权重场景的报错。

变更说明

当前版本对部分历史的废弃模型/代码/资料进行了变更,详细的变更内容及说明如下:

变更内容

变更说明

废弃模型下架

以下模型已下架:Llama3.1、Mixtral、Llm_boost。

贡献者

感谢以下团队人员做出的突出贡献:

  • 天翼云息壤智算团队: RFC !7757 支持MoE专家冷热专家迁移,提升MoE模型训练初期专家负载不均衡时的训练性能。

感谢以下所有在版本周期内参与贡献的开发者:

@ccsszz@chenrayray@hangangqiang@highcloud3@hss-shuai@huan-xiaoling@husichao@jimmyisme@JingweiHuang@lanshaozuishuai@limuan@Lin-Bert@liulili-huawei@liu-yanwei6@lzy0920232@minghu111@niu-junhao01@pengjingyou@qsc97@renyujin@senzhen-town@smallsilly@Somnus2020@song-jiaqi1999@suhaibo@Sunshine_Youngster@wei_zhuoyi@xiaoqi-zhou@yinanf@yiyison@yule100@zhangyihuiben@zyw-hw@zzzkeke

欢迎以任何形式对项目提供贡献!