2023GAIDC:昇思对话数万AI开发者,带领大家现场体验硬科技!
2023GAIDC:昇思对话数万AI开发者,带领大家现场体验硬科技!
2023 GAIDC
2023全球人工智能开发者先锋大会(GAIDC)于2023年2月25日—26日在上海成功举行。大会以“向光而行的开发者”为主题,围绕AI开发者所关注的前瞻探索、开源开放、人才引育、生态培育等方面展开,以AI开发者为核心,为AI开发者带来产业之光、科技之光、未来之光。
在本次大会中,昇思MindSpore在【大会开幕式】、【AI框架与开源生态论坛】、【AI for Science论坛】、【AI数据与开源论坛】、【互动体验区】等多个环节中亮相。众多开源大咖、技术大咖、导师大咖嘉宾和数万AI开发者共同线下参与,同时与上千万专业开发者线上互动交流,现场及线上交流气氛火热!

华为昇思MindSpore业务总经理丁诚出席了本次大会开幕式,与复旦大学浩清特聘教授、复旦大学人工智能创新与产业研究院院长漆远、Kyligence 联合创始人兼CEO韩卿、深势科技创始人&CEO孙伟杰共话人工智能开发者生态建设。在当前我国大力推进高水平科技自立自强的背景下,他们作为本土AI开发者先锋,现场为推进高水平的AI开发者生态建设贡献了真知灼见,并对上海正致力打造的更加开放、更具活力、更为完善的AI开发者生态的表达了向往和憧憬。

在提到大语言模型的未来,丁总表示“大语言模型数据结构的特点就是参数量特别大好比是一个人类具备了超级大脑。而训练模型就好比本身具备超级大脑的人博览群书,接受了各种知识训练,这样一个人如果到各行各业,我相信他都是大有可为的。”

汇聚智慧星火,构建AI新生态
AI 框架作为人工智能的根技术,被认为是 “人工智能基础设施的操作系统”,是联接数据、算法和算力等人工智能要素的关键枢纽。当前,全球主流AI框架和模型的技术演进及创新进展如何?如何提升算法模型的准确率和效率?如何将AI框架和模型应用于实际场景中,实现产业创新?
昇思MindSpore开源生态总监胡晓曼,在AI框架与开源生态论坛给我们做出了解答。在技术生态方面,昇思MindSpore已经与200多所高校、科研机构展开创新合作;在行业生态方面,仅在2022年获得昇思技术认证的企业就超过800多家,涵盖制造、金融、电信运营商等国计民生行业;在开源生态方面,昇思MindSpore在Gitee AI开源项目综合排名TOP1,软件下载增速第一,总量已超过370万。

在AI技术和应用上,华为2012实验室昇思MindSpore超大规模AI架构师苏腾表示,大模型进一步增强AI的通用性,更成为AI技术和应用的新基座。昇思MindSpore原生支持大模型训练,通过全自动并行、可视化智能调优等大幅提升了大模型的开发效率。

其中在大模型并行训练上,昇思MindSpore支持数据并行、MoE并行、优化器并行、多副本并行等7大并行计算能力,将训练千亿模型的代码量降低了80%、调优时间下降60%;和其他主流框架相比,昇思MindSpore是支持模型结构最全的AI框架,包含稠密、稀疏MoE、卷积结构、高维稀疏等。
目前昇思MindSpore已经联合多个科研机构孵化大模型20+,同时,将大模型能力开放给开发者,昇思社区不仅打造了一站式大模型平台——昇思大模型平台,并针对海外开发者打通HuggingFace,实现Inferece API支持MindSpore模型加载、运行,让你我皆可触碰大模型的魅力。

人工智能如何助力科学计算与发现?
人工智能的巨大成功为科学计算带来了新思路、新方法、新工具,而科学计算的严谨体系则有助于提升现有人工智能技术的可解释性。将人工智能引入更底层的科研领域,以处理多维、多模态的大量数据,将有助科学家突破长久以来的研究瓶颈。
在本次AI for Science论坛中,邀请了昇思MindSpore技术总经理于璠、北京大学教授高毅勤等多位嘉宾联袂为大家呈现昇思MindSpore在科学计算的新突破。

昇思MindSpore从创立之初就已经布局科学计算领域,通过多尺度混合计算和高阶混合微分两大关键创新,将昇思原有的AI计算引擎升级为AI与科学计算的统一引擎,实现融合的统一加速。
昇思MindSpore通过架构创新,原生支持科学计算,突破了高阶高维自动微分、自动异构并行、跨尺度计算融合等创新技术,构筑了以八大套件为核心,可广泛支持物理驱动/数据驱动等多种AI科学计算范式的全场景框架。昇思MindSpore面向制造、气象、制药、航空航天、汽车、能源、金融、材料行业规划了八大套件的开发。目前昇思在制造、气象、制药、航空航天领域的四大套件已经投入研发,其中AI电磁仿真MindSpore Elec和AI生物计算MindSpore SPONGE取得了惊人的成果。

作为国内自研的AI+科学计算融合框架,昇思MindSpore积极响应产业界需求,不断在效率提升、易用性、创新性以及使用体验方面推动AI框架持续演进。
数据智能,无限未来
算法、算力和数据是人工智能三大核心要素,也是人工智能的三大基石。华为计算开源业务总经理堵俊平表示,数据集的开放是长期的趋势,越来越多的业界可用的数据集开源开放出来。就像开源一样,对商业更加友好的数据集以合规的形式慢慢开放出来。

AI算法持续突破创新,模型复杂度指数级提升的同时,准确率和效率也在不断提高,在各个细分领域应用加速落地。随着芯片处理能力提升、硬件价格下降、神经网络模型优化,AI算力也在大幅提升。与此同时,AI 产业级应用已经进入大数据、大模型时代。
数据集在AI创新和应用中至关重要。早在机器学习发展初期,吴恩达便提出一定要关心数据集,不要认为拼命把算力或是算法提升就能够解决。尤其对于深度学习算法,数据越多,训练的模型精度、准确率越高。
对数据集而言,框架模型构建了整体开源AI全景图,底层的AI部署,包括AI框架、模型的创建训练、后面的推理以及数据的清洗、ETL等,都是在数据层面。每一层都有大量的开源项目大行其道,而且发展得越来越好。

华为主任工程师、昇思MindSpore社区Maintainer李自表示,当前面对类似ChatGPT等AIGC大模型的爆发式应用,AI数据和模型带来的版权和隐私问题也日益凸显,华为作为核心贡献者参与SPDX AI元数据国际标准建设,通过开源生态与业界共同探索如何从供应链角度识别AI合规和安全风险。成果目前已在昇思MindSpore社区落地,支撑了200+数据集和20+大模型合规安全发布,未来华为会继续携手生态伙伴完善标准和配套工程能力的建设,推动AI向善。

悟空画画大模型亮相
在互动体验区——昇思MindSpore展区,中文文图生成模型-悟空画画大模型亮相,活动现场超上千名开发者参与体验,创作出多样风格场景的图片。

悟空画画文图生成模型基于Diffusion结构进行开发,使用中文亿级文图数据进行训练,借助悟空中文视觉-语言预训练模型的判别能力实现更好的中文图文匹配度,能够理解各类常见物体与场景描述,并能自适应多种绘画风格。
AIGC的爆红出圈开启了这一行业的“元年”,随着虚拟数字人的学习、表达、交互能力大幅提升,在各种场景中拓宽这AIGC应用的空间。昇思MindSpore将在这一行业持续深耕,为设计师提供创作灵感,真正的让AI与人类携手展示艺术的创新。
2023全球人工智能开发者先锋大会(GAIDC)精彩纷呈,亮点不断。新一代人工智能的高质量发展,离不开高水平科技成果的夯基垒台,昇思MindSpore非常有幸为大会贡献自己的力量。期待明年继续与千万开发者共同发展好新一代人工智能!