MindSpore Transformers
介绍
快速开始
整体架构
模型支持库
安装
安装指南
功能特性
功能特性概述
配置文件说明
数据集
训练超参数与优化器
静态图实现特性
贡献指南
MindSpore Transformers贡献指南
魔乐社区贡献指南
FAQ
模型相关 FAQ
功能相关 FAQ
静态图实现(Deprecated)
整体架构
大模型全流程指南
功能特性
高阶开发
优秀实践
制作 MindSpore Transformers 的 Docker 镜像的实践案例
使用DeepSeek-R1进行模型蒸馏的实践案例
转换模型权重为Megatron模型权重的实践案例
MindSpore Transformers对接通用评测工具的实践案例
使用GLM4-9B进行多卡模型微调的实践案例
环境变量说明
MindSpore Transformers
»
优秀实践
查看页面源码
优秀实践
制作 MindSpore Transformers 的 Docker 镜像的实践案例
使用DeepSeek-R1进行模型蒸馏的实践案例
转换模型权重为Megatron模型权重的实践案例
MindSpore Transformers对接通用评测工具的实践案例
使用GLM4-9B进行多卡模型微调的实践案例