代码
请查收昇思MindSpore运作报告(2024年一季度)!重磅活动、全新版本等内容速览

请查收昇思MindSpore运作报告(2024年一季度)!重磅活动、全新版本等内容速览

请查收昇思MindSpore运作报告(2024年一季度)!重磅活动、全新版本等内容速览

昇思MindSpore2024年一季度总结

一、概述

2024年3月底,昇思MindSpore社区理事会、技术委员会会议在北京召开,会上,在昇思MindSpore业务发展、技术布道、生态拓展、人才培养、应用等方面进行了研讨。

在近期SIG组工作中,MindQuantum SIG正式发布MindSpore Quantum0.9版本。MindElec&SciAI SIG联合清华大学、华为先进计算与存储实验室构建了大地电磁智能反演模型。MindFlow&Earth SIG发布MindEarth0.2.0版本,新增NowcastNet、GraphCast、伏羲等多个模型。MindSPONGE SIG新增Pafuncy模型用于预测蛋白质-配体复合物亲和性的深度卷积神经网络。

经过社区开发者们的开发与贡献,昇思MindSpore2.3版本全新发布,实现大模型开发训练推理更简、更稳、更高效。训练上,分布式训练升级至8种并行技术,推出通过编译快照、确定性CKPT等技术,实现任务稳定执行与故障快速恢复。部署上,升级训推一体架构实现脚本、分布式策略、运行时的统一。开发上,全新发布MindSpore One生成式套件,兼容Diffusers库,开箱即用;持续升级MindSpore TransFormers大模型套件,快速完成大模型任务开发。

以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024在北京国家会议中心举办,旨在汇聚AI产业界创新力量,推动根技术持续创新,共建人工智能开源新生态。

二、社区规模

截至3月底,昇思MindSpore面向全球开发者,凝聚产业力量,持续打造人工智能创新之源。社区秉持开放透明原则,稳步建设开源生态,规模和活跃度得到持续提升。

昇思MindSpore累计下载量为700W+,2024年一季度增长了40W+

发展25000多名核心贡献者;

累计产生ISSUE共37.5K、PR共90.4K

三、社区大事件

1、昇思人工智能框架峰会2024圆满举办

人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。3月22日,以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024在北京国家会议中心举办,旨在汇聚AI产业界创新力量,推动根技术持续创新,共建人工智能开源新生态。

2、昇思MindSpore开源社区助力书生·浦语大模型实战营开课

为了帮助社区用户高效掌握和广泛应用大模型技术,昇思MindSpore社区携手上海人工智能实验室重磅推出书生·浦语大模型实战营系列活动,旨在为开发者们提供全面而系统的大模型技术学习课程,并建立一个友好的交流平台,便于大家在大模型实践开发中分享经验、交流思想。

3、基于昇思MindSpore Chemistry化工领域套件打造的化工大模型在昇思人工智能框架峰会2024发布

中国科学院大连化学物理研究所(以下简称“大连化物所”)低碳催化与工程研究部叶茂研究员和刘中民院士团队与华为技术有限公司在前期合作基础上,联合大连理工大学软件学院、榆林中科洁净能源创新研究院等开发了智能化工大模型1.0版本,并在“昇思人工智能框架峰会2024”上发布。

4、软通动力大模型一体机在昇思人工智能框架峰会2024发布

以"为智而昇,思创之源"为主题的昇思人工智能框架峰会2024在北京国家会议中心举办,软通动力在峰会展区亮相了"AI训推一体化平台",软通AI训推一体化平台支持昇思MindSpore 全场景AI框架,具备用户态易用、运行态高效、部署态灵活的特点,可以为用户提供设计友好、运行高效的开发体验。

5、中国人工智能学会-昇思MindSpore学术基金项目开工会圆满举办

2024年2月2日,中国人工智能学会-昇思MindSpore学术基金项目开工会成功举办,中国人工智能学会、鹏城实验室、华为技术有限公司和高校及科研院所62位专家及老师参与会议。

会上,中国人工智能学会理事长、中国工程院院士戴琼海,鹏城实验室主任、中国工程院院士高文分别致辞。清华大学电子工程系副教授、国家杰青获得者方璐主持开工会并汇报了项目执行计划。

6、科大讯飞首发开源大模型“星火开源-13B” 深度适配昇思MindSpore AI框架

1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。发布会上依托昇思MindSpore AI框架打造的讯飞星火开源大模型“星火开源-13B”正式发布,开源模型场景应用效果领先,目前已在Gitee的MindFormers代码仓开源,用户可在昇思MindSpore开源社区线上体验。

7、第五届MindCon极客周圆满收官!

MindCon极客周是昇思MindSpore开源社区每年举办的开发者狂欢盛会!凭借热爱,我们带领社区开发者从0 到1参与开源贡献,开启了众多热爱开源开发者的封神之路!第五届MindCon极客周圆满收官!我们又收获了更多开源爱好者一起修复社区Bugfix,贡献开源社区,分享 AI 前沿技术,与更多开源爱好者共同探索人工智能的无穷可能。

8、中国电信星辰语义大模型正式开源,携手昇腾共建开源大模型生态

1月10日,中国电信星辰语义大模型TeleChat-7B版本宣布开源,并开放1T高质量清洗数据集。星辰语义大模型已与昇腾AI基础软硬件完成适配,并开源了适配后的代码。此外,中国电信还将在1月20日开源12B版本模型,拥抱更多开发者共建开源大模型生态。

9、重磅发布 | “基于昇思MindSpore的智能通信”实践课程在兰州大学正式上线!

兰州大学袁磊副教授依托教育部-华为“智能基座”产教融合协同育人基地“金课”建设项目,建设了“基于昇思MindSpore的智能通信”在线实践课程。本课程以深度学习和昇思MindSpore基础知识为切入点,构建了多个富有挑战性的智能通信实践案例,通过逐步深入的实践使学生掌握智能通信系统的开发流程和实际应用。

四、社区治理

3月21日,昇思MindSpore开源社区技术委员会会议和昇思MindSpore开源社区理事会会议在北京国家会议中心召开。

会上,完成了昇思MindSpore开源社区技术委员会和理事会会议的各项议程,保障社区持续高效的运作。同步了社区进展、昇思MindSpore技术规划以及运作机制更新,围绕昇思MindSpore业务发展、生态和技术发展,在昇思MindSpore业务发展、技术布道、生态拓展、人才培养、应用等方面和委员会成员进行了研讨。

五、技术进展

1**、**大模型首选AI框架,昇思MindSpore2.3版本全新发布大模型首选AI框架

经过社区开发者们的开发与贡献,昇思MindSpore2.3版本全新发布,实现大模型开发训推更简、更稳、更高效。

  • 训练:通过原创多副本、多流水交织等8种并行技术,整图优化及下沉执行实现更快的分布式训练,集群线性度达到90%;通过编译快照、确定性CKPT等技术,实现任务稳定执行与故障20分钟内快速恢复。
  • 部署:升级训推一体架构实现脚本、分布式策略、运行时的统一,大模型推理部署仅需1天。通过LLM Serving以及FlashAttention等10+融合大算子,实现推理时延降低一半,吞吐提升2倍多;
  • 开发:全新发布MindSpore One生成式套件,兼容Diffusers库,开箱即用,一周完成生成式模型开发;持续升级MindSpore TransFormers大模型套件、预置30+热门预训练大模型,提供10+大模型微调算法,快速完成大模型任务开发。

**2、**MindQuantum SIG:新增密度矩阵和噪声模拟后端,昇思MindSpore Quantum0.9全新版本发布

MindSpore Quantum0.9版本已正式发布,在新版本中对量子模拟器、量子门、量子线路和量子算法库等均做了大量更新迭代,实现全新技术升级,使能科研创新和产业应用。0.9版本新增密度矩阵模拟器,在进行混态模拟、开放系统模拟和含噪模拟时十分重要,新版本中提供强大的信道管理工具,可根据实际情况生成噪声模型,并最终完成噪声模拟。

该版本提供量子芯片拓扑结构描述的类型QubitsTopology,还内置了线性拓扑结构LinearQubits和方格拓扑结构GrudQubits, 同时支持更多量子门。新版本不仅提供了新的19个Ansatz从而加快变分量子算法开发,还在优化了精度自由切换功能最大化利用内存空间。

项目地址:

https://gitee.com/mindspore/mindquantum

3、MindElec SIG联合清华大学、华为先进计算与存储实验室发布大地电磁智能反演模型

昇思MindSpore Elec联合清华大学、华为先进计算与存储实验室构建了大地电磁智能反演模型。通过VAE变分自编码器灵活嵌入多物理先验知识,从而有效提升了复杂介质地球物理反演的精度,成功地处理了南部非洲大地电磁实验项目(SAMTEX)的实测数据。

项目地址:https://gitee.com/mindspore/mindscience/tree/master/MindElec/examples/hybrid\_driven/feature\_based\_MT\_inversion

**4、**MindEarth发布0.2.0版本,新增多个短临降水、中期预报与长期气候预报模型

地球科学领域套件MindEarth支持多时空尺度气象预报、数据前后处理等任务,致力于高效使能AI+气象海洋的融合研究。MindEarth0.2.0针对短临降水、中期预报与长期气候预报多时空尺度预报任务,新增以下特性:

  • 新增NowcastNet模型,该模型是基于物理约束的生成式短临降水模型,支持未来3小时的雷达外推降水预报,并发表于Nature。
  • 新增GraphCast模型0.25°高分辨率数据训练,实现GraphCast全尺度模型训练与推理。
  • 新增气象模型伏羲,支持中期预报模型的训练和推理。
  • 新增中期降水模块案例,支持中期的降水量预报,需要基于预训练的中期大模型做为backbone。
  • 新增基于CNN与迁移学习的厄尔尼诺预测模型,将ENSO有效预报时长延长至19个月。

项目地址:https://gitee.com/mindspore/mindscience/tree/master/MindEarth

5、昇思****MindSpore SPONGE新增亲和性预测Pafuncy模型

昇思MindSpore SPONGE是一款基于昇思MindSpore的计算生物领域套件,支持分子动力学、蛋白质折叠等常用功能。本季度昇思MindSpore SPONGE套件持续性优化,新增亲和性预测Pafuncy模型,具体新增特性如下:

  • 昇思MindSpore SPONGE框架已基于新一代昇腾硬件进行适配和优化,能更快更稳定运行现有计算生物模型,整体性能表现提升;
  • megafold适配lazy inline:megafold的evoformer fold_iteration中存在大量循环,编译性能存在提升空间;新增cus_lazy_inline接口,使用lazy inline大幅度减少重复编译的时间;
  • megafold代码合并优化:提取蛋白质结构预测需要的数据库检索与结构弛豫作为独立模块提供,新增目录application/common_utils/, 补全Pipeline端到端结构预测模型能力;
  • 新增pafnucy模型:该模型是用于预测蛋白质-配体复合物亲和性的深度卷积神经网络,使用三维网格表征复合物,并基于3D卷积生成该表征的特征图,以相同的方式处理蛋白质和配体的原子。

项目地址:https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE

六、认证

**1、**重庆大学推出OpenGADL通用智能计算软件平台

在重庆人工智能创新中心的支持下,重庆大学类脑感知与普适智能科学研究院周喜川教授团队基于昇腾AI基础软硬件平台,推出OpenGADL通用智能计算软件平台。该平台面向“零基础”AI应用开发者,提供丰富易用的深度学习算法开发工具,能够大大降低行业大模型开发门槛,推动开放产业生态。

**2、**阿凡达机器人携手各高校,推进人工智能教育方式变革

近日,南京阿凡达机器人科技有限公司的“学科教育大模型综合实验平台”完成昇腾技术认证。本项目基于昇思MindSpore框架,在Mindformer套件的大语言模型Baichuan中的智能回答能力的认证测试,实现了中医、法律等领域的智能对话功能,为高校开发者提供一站式大模型训练学习平台,具有高效能多模态、低门槛轻量化、多场景高通用的特点,有效降低了大模型教学的整体成本和难度,助力高校师生实现大模型的学习、训练、竞赛及应用。

七、感谢每一位朋友、开发者的支持

感谢大家的辛勤贡献,昇思MindSpore每天都有所进步。由于小编视野局限,如有疏漏,在此表示歉意。再次感谢社区伙伴、小孢子们以及每位参与社区贡献的人们。

截至2024年3月底,昇思MindSpore下载量已超过700W,未来,昇思MindSpore AI框架将持续致力于打造人工智能创新之源,凝聚产业力量,扎根AI根技术,使能大模型与科学智能,成为AI创新的首选框架。