高阶开发概述
MindSpore Transformers 高阶开发面向模型迁移、调优与精度验证等进阶场景,帮助用户在完成基础训练与推理后,进一步做开发迁移、调试调优和精度对比。本章节按 调试调优、模型开发与配置、精度对比 和 API 参考 对全部高阶开发文档进行分类汇总,便于快速查找与跳转。
调试调优
面向训练与推理过程中的精度与性能问题,提供系统化的排查与优化方法。
文档 |
说明 |
架构支持 |
|---|---|---|
大模型训练常见精度问题与通用定位方法,包括 CheckList、参数对齐、随机性固定及长稳排查等。 |
Mcore/Legacy |
|
大模型性能调优思路与工具,涵盖数据加载、前反向计算、通信与调度等环节的优化及 Profile 使用指导。 |
Mcore/Legacy |
模型开发与配置
支持从零构建或迁移模型,以及通过配置模板快速拉起训练与推理任务。
文档 |
说明 |
架构支持 |
|---|---|---|
基于 MindSpore Transformers 构建大模型的完整流程,包括配置、模型、分词器与 YAML 配置的编写与适配。 |
Legacy |
|
推理场景下 YAML 配置模板的使用方法,支持按 Hugging Face/ModelScope 模型目录快速配置并启动推理。 |
Mcore |
|
预训练与微调的通用配置模板说明,支持稠密/MoE 等场景,便于未支持规格或自定义模型的训练任务快速启动。 |
Mcore |
|
将新模型适配 MindSpore Transformers 权重转换功能,实现 Hugging Face 权重到 MindSpore 权重的统一转换与加载。 |
Mcore |
精度对比
用于验证与标杆实现或 GPU 环境在训练与推理层面的一致性。
文档 |
说明 |
架构支持 |
|---|---|---|
与 Megatron-LM 在模型层面的训练精度对齐方法,包括等价结构构建、前向/损失/梯度等关键指标对比。 |
Mcore |
|
推理精度验收流程与定位思路,涵盖在线推理验证、数据集评测及常见问题的排查与解决。 |
Mcore |
API 参考
MindSpore Transformers 各模块的 API 文档入口。
文档 |
说明 |
|---|---|
mindformers 及各子模块的 API 索引与详细接口说明。 |