# 模型库 [](https://gitee.com/mindspore/docs/blob/r2.4.0/docs/mindformers/docs/source_zh_cn/start/models.md) 当前MindFormers支持的模型列表如下:
| 模型 | 参数 | 序列 | 预训练 | 微调 | 推理 | 训练性能(配置/硬件) | 推理性能(配置/硬件) |
|---|---|---|---|---|---|---|---|
| LLama2 | 7B | 4K | pretrain | finetune | predict | 4160 tokens/s/p 配置 Atlas 800T A2 |
332 tokens/s 配置 Atlas 800T A2 |
| 13B | 4K | pretrain | finetune | predict | 1691 tokens/s/p 配置 Atlas 800T A2 |
420 tokens/s 配置 Atlas 800T A2 |
|
| 70B | 4K | pretrain | finetune | predict | 337 tokens/s/p 配置 Atlas 800T A2 |
522 tokens/s 配置 Atlas 800T A2 |
|
| LLama3 | 8B | 8K | pretrain | finetune | predict | 2581 tokens/s/p 配置 Atlas 800T A2 |
- |
| 70B | 8K | pretrain | finetune | predict | 337 tokens/s/p 配置 Atlas 900 A2 PoDc |
- | |
| LLama3.1 | 8B | 8K | - | finetune | predict | 2703 tokens/s/p 配置 Atlas 900 A2 PoDc |
591 tokens/s 配置 Atlas 800T A2 |
| 70B | 8K | - | finetune | predict | 337 tokens/s/p 配置 Atlas 900 A2 PoDc |
509 tokens/s 配置 Atlas 800T A2 |
|
| Baichuan2 | 7B | 4K | - | finetune | predict | 3164 tokens/s/p 配置 Atlas 800T A2 |
521 tokens/s 配置 Atlas 800T A2 |
| 13B | 4K | - | finetune | predict | 1465 tokens/s/p 配置 Atlas 800T A2 |
224 tokens/s 配置 Atlas 800T A2 |
|
| GLM2 | 6B | 2K | - | finetune | predict | 815.2059134 tokens/s/p 配置 Atlas 800T A2 |
32.08 tokens/s (seq_length=512) 配置 Atlas 800T A2 |
| GLM3 | 6B | 2K | - | finetune | predict | 3450 tokens/s/p 配置 Atlas 800T A2 |
627 tokens/s 配置 Atlas 800T A2 |
| GLM3-32K | 6B | 32K | - | finetune | predict | 1583 tokens/s/p 配置 Atlas 800T A2 |
876 tokens/s 配置 Atlas 800T A2 |
| GLM4 | 9B | 8K | - | finetune | predict | 2339 tokens/s/p 配置 Atlas 900 A2 PoDc |
256 tokens/s 配置 Atlas 800T A2 |
| CogVLM2-Video | 13B | 2K | - | finetune | predict | - | - |
| CogVLM2-Image | 19B | 4K | - | - | predict | - | - |
| Qwen | 7B | 8K | - | finetune | predict | 2955 tokens/s/p 配置 Atlas 800T A2 |
23 tokens/s 配置 Atlas 800T A2 |
| 14B | 8K | - | finetune | predict | 1106 tokens/s/p 配置 Atlas 800T A2 |
35 tokens/s 配置 Atlas 800T A2 |
|
| Qwen1.5 | 7B | 32K | pretrain | finetune | predict | 2684 tokens/s/p 配置 Atlas 800T A2 |
164 tokens/s 配置 Atlas 800T A2 |
| 14B | 32K | pretrain | finetune | predict | 1452 tokens/s/p 配置 Atlas 800T A2 |
104 tokens/s 配置 Atlas 800T A2 |
|
| 72B | 32K | pretrain | finetune | predict | - | 74 tokens/s 配置 Atlas 800T A2 |
|
| Qwen2 | 0.5B | 32K | - | finetune | predict | 9555 tokens/s/p 配置 Atlas 900 A2 PoDc |
1907 tokens/s 配置 Atlas 800T A2 |
| 1.5B | 32K | - | finetune | predict | 4363 tokens/s/p 配置 Atlas 900 A2 PoDc |
1160 tokens/s 配置 Atlas 800T A2 |
|
| 7B | 32K | - | finetune | predict | - | 645 tokens/s 配置 Atlas 800T A2 |
|
| 57B-A14B | 8K | - | finetune | predict | 288 tokens/s/p 配置 Atlas 900 A2 PoDc |
- | |
| 57B | 32K | - | finetune | predict | - | - | |
| 72B | 128K | - | finetune | predict | 2026 tokens/s/p 配置 Atlas 900 A2 PoDc |
252 tokens/s 配置 Atlas 800T A2 |
|
| Qwen-VL | 9.6B | 2K | - | finetune | predict | 2587 tokens/s/p 配置 - |
42 tokens/s 配置 - |
| InternLM | 7B | 2K | - | finetune | predict | 3250 tokens/s/p 配置 Atlas 800T A2 |
62 tokens/s 配置 Atlas 800T A2 |
| 20B | 2K | - | finetune | predict | - | 296 tokens/s 配置 Atlas 800T A2 |
|
| InternLM2 | 7B | 2K | - | finetune | predict | - | - |
| 20B | 4K | - | finetune | predict | - | - | |
| Yi | 6B | 2K | pretrain | finetune | predict | 3324 tokens/s/p 配置 Atlas 800T A2 |
31 tokens/s 配置 Atlas 800T A2 |
| 34B | 4K | pretrain | finetune | predict | 660 tokens/s/p 配置 Atlas 800T A2 |
41 tokens/s 配置 Atlas 800T A2 |
|
| Mixtral | 8x7B | 32K | pretrain | finetune | predict | - | - |
| DeepSeek Coder | 33B | 4K | pretrain | finetune | predict | 572 tokens/s/p 配置 Atlas 900 A2 PoDc |
292 tokens/s 配置 Atlas 800T A2 |
| DeepSeek Coder1.5 | 7B | 4K | - | finetune | predict | 340 tokens/s/p 配置 Atlas 900 A2 PoDc |
60 tokens/s 配置 Atlas 800T A2 |
| DeepSeekV2 | 236B | 4K | - | finetune | predict | 36 tokens/s/p 配置 Atlas 900 A2 PoDc |
- |
| CodeLlama | 34B | 4K | pretrain | finetune | predict | 667 tokens/s/p 配置 Atlas 800T A2 |
139 tokens/s 配置 Atlas 800T A2 |
| GPT2 | 13B | 2K | pretrain | finetune | predict | 1376 tokens/s/p 配置 Atlas 800T A2 |
21 tokens/s 配置 Atlas 800T A2 |
| Whisper | 1.5B | - | - | finetune | - | - | - |