代码
MindSpore AKG Meetup北京站圆满举办 | 产学研聚力 共探算子技术创新 共建开源生态

MindSpore AKG Meetup北京站圆满举办 | 产学研聚力 共探算子技术创新 共建开源生态

MindSpore AKG Meetup北京站圆满举办 | 产学研聚力 共探算子技术创新 共建开源生态

随着大模型代码生成能力不断成熟,高校与厂商纷纷投身 LLM 算子生成技术探索。

4 月 29 日,昇思 MindSpore 社区与北京航空航天大学联合举办 MindSpore AKG Meetup 北京站。活动线上线下同步开展,汇聚北航计算机学院、昇思社区等超过3000名开发者,聚焦算子智能生成、大模型编译等方向,以产学研协同推动 AKG 技术迭代与开源生态建设。

AKG Agent 是本次活动核心技术成果,自 2025 年初布局 Agent 算子生成能力,现已打造自动化 Multi-Agent 生成系统,搭载分层 Skill、自适应并发搜索、AutoResearch 深度搜索等核心技术,昇腾算子生成效果优异:Triton-ascend 78% 达 0.8x torch_npu、66% 达 1.0x torch_npu(Eager 模式)。

01 开场致辞:明确共建方向

北京航空航天大学计算机学院副院长杨海龙致辞,期待以本次活动为纽带深化校企合作,推动科研成果转化,培育算子智能生成领域人才。

02 技术报告环节

致辞结束后,活动进入核心技术报告环节。多位专家围绕算子智能生成、多智能体优化、异构计算、稀疏大模型以及AI辅助开发等主题进行了系统分享。

Part 1 :算子智能生成与多智能体优化 MindSpore AKG SIG 技术专家易衍智分享《基于 Agent 的算子自动生成简介与 AKG Agent》,讲解多角色架构、模块化 Skill 系统,以及 Sketch 并发搜索与 AutoResearch 优化框架。

实际应用中,该方案可降低 20% Token 消耗、提升 10% 算子性能、缩短 30% 整体耗时;矩阵计算、混合分组直方图等算子耗时从 2193us 降至 168us、8245us 降至 606us,KernelBench Level1 算子通过率 100%。

北京航空航天大学游心老师分享《基于多智能体协同优化的高性能算子自动生成系统》,针对算力供需失衡问题,提出细粒度元提示、测试驱动自修复、评测驱动协同优化三大技术。

实测效果:GPU 算子生成 Pass@1 从 88% 升至 95%,NPU 从 69% 升至 71%;CPU 平均加速 2.81 倍、GPU 平均加速 2.30 倍,最高达 10.95 倍,可稳定运行 Attention 等复杂算子。

Part 2 :异构计算与稀疏大模型优化 北京航空航天大学解晨浩老师分享《面向异构超算的多维分块稀疏矩阵研究及应用》,提出多维分块稀疏矩阵计算模型。

实际效果:油气藏数值模拟场景中,100 节点较 50 节点实现近 2 倍加速;DiT 模型推理中,RT-Lynx 稀疏算子最高加速 1.79 倍,显著提升异构超算与稀疏计算效率。

北京航空航天大学孙庆骁老师,分享《面向稀疏大模型推理的算子实现及编译优化研究介绍》,核心如下: 1.痛点直击:针对稀疏大模型推理瓶颈,明确算子开发与编译优化需求。 2.优化手段:讲解编译优化、内存对齐等提升推理效率的方法。 3.解决方案:提供大模型轻量化部署与高效推理的完整方案。

Part 3 :开源生态与AI辅助开发 CANN 开源技术专家张雨晨分享《CANN 社区及 CANNBot 介绍》,介绍 CANN 社区生态与 CANNBot 三层架构、全流程自动化工作流。

实际效果:CANNBot 将 Ascend C 算子开发周期从天级压缩至小时级,Abs 算子仅需 1 小时即可完成全流程开发,大幅降低开发门槛。

操作系统技术专家李屹,压轴分享《从测试、代码迁移到端到端功能实现 —AI 辅助开发的思考与程序员的未来》,核心如下: 1.实践历程:分享团队AI开发三阶段及效率提升成效。 2.AI局限:指出大模型能力边界,难以兼顾架构优美与需求深层解读。 3.未来启示:AI替代重复性劳动,程序员核心竞争力在业务洞察与创新。

03 总结与展望

本次MindSpore AKG Meetup北京站搭建了产学研三方交流平台,普及前沿技术、凝聚开源力量、深化校企融合。未来,昇思MindSpore AKG将持续落地多地Meetup活动,深耕算力技术创新,汇聚开发者智慧,打造开放共赢的AI开源生态。