大模型开发与适配
大模型训练是一种非常复杂的过程,涉及到分布式并行领域许多技术和挑战,当前Megatron已经成为业界主流的大模型加速库。为满足用户大模型代码更快在MindSpore上迁移使用,MSAdapter当前版本已经支持MindSpeed加速库,兼容Megatron生态。当前已经支持DeepSeek/Qwen等主流模型,未来MSAdapter持续演进,支持更多业界主流生态模型。
希望学习使用MSAdapter进行大模型开发请参考:MindSpeed MindSpore后端迁移开发指南。
此外,在MindSpeed加速库的基础上也提供了大语言模型、多模态模型套件加速库,用户可以安装MSAdapter及配套昇腾软件直接使用:
大语言模型库:MindSpeed-LLM
多模态模型库:MindSpeed-MM