代码
这是一个科技公司疯狂厮杀、我们静享大模型成果的黄金时代~(资讯更新系列)

这是一个科技公司疯狂厮杀、我们静享大模型成果的黄金时代~(资讯更新系列)

这是一个科技公司疯狂厮杀、我们静享大模型成果的黄金时代~(资讯更新系列)

A:Hello,小麦(小Mi),请播报近期AI类新闻

B:1.OpenAI 2024 Spring 发布的支持实时语音对话的模型 GPT-4O;2.昌平实验室联合昇思MindSpore打造“天工”抗体设计模型,引领生物医药行业创新加速;谷歌 DeepMind 推出新一代药物研发 AI 模型 AlphaFold 3......

过去的两周,国内外的大模型科技公司依旧马不停蹄地更新迭代推广新产品,疯狂厮杀,GPT-4O的推出是否又会带来新一轮AI配音界的变革,AI视频的人物角色不也是机械式地读书,而是进行带有喜悦、愤怒等多种情感对话?为了更好的帮助大家理解这个日新月异的AI世界,本期继续给大家普及几个常见的大模型科技公司和组织~

1.OpenAI是一个致力于人工智能研究和应用的非盈利组织,它由埃隆·马斯克(Elon Musk)和其他几位科技企业家于2015年共同创立。OpenAI的目标是通过开发和推广安全、可靠的AI技术,来确保人工智能的积极影响,并防止其被滥用。已推出GPT系列、DALL-E等AI模型。

2.Meta,原名Facebook,是一家全球知名的科技公司,由马克·扎克伯格(Mark Zuckerberg)创立于2004年。随着时间的推移,业务范围扩展到虚拟现实(VR)、增强现实(AR)和人工智能(AI)等多个领域。Meta 发布了多个大型语言模型(LLM),主要包括 Llama 系列和Meta AI 助手

3.Deepmind,DeepMind 是一家位于伦敦的人工智能研究实验室,以其在深度学习和强化学习领域的开创性工作而闻名。发布了多个大型模型,其中包括:Gemin、Gopher(专注于强化学习领域)、FunSearch、Gemma等

4.百度是中国最大的搜索引擎公司,同时也是一家在全球范围内具有影响力的人工智能(AI)公司,涉及自动驾驶、智能语音、深度学习等多个方面。“文言一心”是百度推出的一款大型语言模型,它基于百度自研的ERNIE(Enhanced Representation through kNowledge Integration)技术。

5.华为是一家全球领先的信息与通信技术(ICT)解决方案提供商,其产品和服务涵盖了移动设备、宽带网络、数据中心和云计算等多个领域。华为在人工智能(AI)领域的发展同样令人瞩目。华为的盘古大模型是基于昇腾AI处理器和鲲鹏处理器构建的全栈AI软硬件平台的一部分。盘古大模型与MindSpore AI框架以及ModelArts AI开发平台共同构成了华为的AI技术生态。总的来说,华为的盘古大模型是在昇腾AI处理器和鲲鹏处理器提供的算力基础上,通过MindSpore AI框架进行训练和优化,并在ModelArts AI开发平台上进行应用开发和部署的。

可以想象,不管是国内还是国外,我们的生活即将发生翻天覆地的变化,这是一个科技公司疯狂厮杀、我们静享大模型成果的黄金时代~

那么本期推出的主要资讯内容如下:

1.大模型首选AI框架——昇思MindSpore2.3.RC1版本上线开源社区

经过社区开发者们几个月的开发与贡献,现正式发布昇思MindSpore2.3.RC1版本,通过多维混合并行以及确定性CKPT来实现超大集群的高性能训练,支持大模型训推一体架构,大模型开发训练推理更简、更稳、更高效,并在训推一体框架的基础上通过多样的大模型推理优化技术,进一步降低大模型推理成本;通过使能kernel by kernel调度执行,进一步提升静态图调试调优能力;持续升级昇思MindSpore TransFormers大模型套件和昇思MindSpore One生成式套件,全流程开箱即用,一周即可完成大模型全流程的开发、验证;创新AI+科学计算(科学智能)范式,孵化科学领域基础大模型。

2.OpenAI 2024 Spring 发布支持实时语音对话的模型 GPT-4O

5月14日凌晨,OpenAI在官网正式发布了新旗舰模型GPT-4o,可跨视频、音频、文本进行实时推理,全球生成式AI领域再次迎来历史性时刻。OpenAI通过GPT-4o打造的语音版ChatGPT助手,可以与用户跨音频、视频进行交流。 这意味着ChatGpt不再是一个文本驱动的工具,它可以听、看和说话,将开启全新的可能性,从实时图像分析到语音交流,对特定用户群体,如视觉障碍者也是一个福音。

3.谷歌 DeepMind 推出新一代药物研发 AI 模型 AlphaFold 3

谷歌DeepMind发布了新一代预测蛋白质结构的AlphaFold 3模型,能够帮助科学家更精确地针对疾病机制,从而开发出更有效的治疗药物。DeepMind研究人员表示,AlphaFold 3是一种人工智能(AI)模型,它可以预测蛋白质、DNA、RNA等生物分子的结构以及它们如何相互作用。

在2018年,DeepMind推出了第一代AlphaFold模型,在国际蛋白质结构预测竞赛中获得了第一名。2020年,AlphaFold 2继续显示出惊人的预测准确度,被认为是蛋白质结构预测领域的里程碑式突破。如今,AlphaFold 3则更进一步,预测了几乎所有生物分子的结构,并模拟了这些分子之间的相互作用。虽然研究人员早已开发出专门的计算方法来模拟特定类型的生物分子之间的相互作用,但AlphaFold 3是首次有一个单一的系统能够以最先进的性能预测几乎所有分子类型之间的相互作用。

4.手机厂商纷纷押注 AI ,认定2024 年是 AI 手机元年

2023 年下半年至今,AI 大模型浪潮席卷智能手机行业,手机厂商陆续将大模型能力应用在手机产品上。近日,OPPO CEO 陈明永发表内部信称,2024 年是 AI 手机元年。未来五年,AI 对手机行业的影响,完全可以比肩当年智能手机替代功能机。2 月 20 日,OPPO 举办 AI 战略发布会,OPPO 首席产品官刘作虎表示,「AI 手机将是继功能机、智能机之后,手机行业的第三个重大的变革阶段。」同时,OPPO 专门成立了 AI 中心,将资源向 AI 集中。

5.马斯克开源 Grok-1,该混合专家模型拥有 3140 亿参数,系迄今最大

马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构,这也使得Grok-1成为当前参数量最大的开源大语言模型。知名机器学习研究者、《Python 机器学习》畅销书作者 Sebastian Raschka 评价道:「Grok-1 比其他通常带有使用限制的开放权重模型更加开源,但是它的开源程度不如 Pythia、Bloom 和 OLMo,后者附带训练代码和可复现的数据集。」

DeepMind 研究工程师 Aleksa Gordié 则预测,Grok-1 的能力应该比 LLaMA-2 要强,但目前尚不清楚有多少数据受到了污染。另外,二者的参数量也不是一个量级。

6.通义 APP 上线照片唱歌功能,可让「赫本唱上春山,爱因斯坦说中文段子」

近日,EMO终于上线通义APP,并开放给所有用户免费使用。打开通义APP,进入“全民舞台”频道,看到EMO产品页面显示有“全民唱演”。在歌曲、热梗、表情包中任选一款模板,上传肖像照片,EMO随即就能合成视频。让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子……都能成为现实!

7.人工智能“复活”已故明星引发争议,如何看待用“数字生命”复活逝者

最近,网上出现了一些用人工智能“复活”的已故明星的视频片段,引发大量争议。清华大学社会科学学院院长彭凯平教授近日接受采访时谈到,从心理的康复角度来讲,长期生活在虚拟的形象和生活中是一种消极的生活态度,可能会让我们逐渐丧失真实的自我感受,因此,逝去亲人的“数字生命”不能作为长期陪伴,要遵循三大原则来防止沉浸。

8.零一万物2C单款产品今年预计收入过1亿元,产品ROI接近1

去年3月,李开复宣布以Project AI2.0之名入局大模型,而后领衔创新工场第七家塔尖孵化公司零一万物,冲入大模型赛道。如今,零一万物成立一年有余,旗下模型陆续推出,成绩霸榜;开源闭源两手抓,同步推进;API平台开放,全球可用;产品AI助手万知,小程序免费可用。在大模型之路上全栈推进,似乎成了外界对零一万物的共同认知。而且在市场方面,零一万物成立不足一年就跻身独角兽行列,被外界称为国产大模型五虎之一。其海外2C产品上线9个月用户近千万,今年单款产品预计收入过亿元,产品ROI(投入产出比)接近1。

9.微软打破Decoder-Only架构!大幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运行

微软&清华最新研究,打破GPT系列开创的Decoder-Only架构——提出Decoder-Decoder新型架构,名为YOCO(You Only Cache Once)。YOCO仅缓存一次键值对,可大幅降低GPU内存需求,且保留全局注意力能力。在处理512K上下文长度时,标准Transformer内存使用是YOCO的6.4倍,预填充延迟是YOCO的30.3倍,而YOCO的吞吐量提升到标准Transformer的9.6倍。

10.港大开源图基础大模型OpenGraph: 强泛化能力,前向传播预测新数据

图学习领域的数据饥荒问题,又有能缓解的新花活了!OpenGraph,一个基于图的基础模型,专门用于在多种图数据集上进行零样本预测。背后是港大数据智能实验室的主任Chao Huang团队,他们还针对图模型提出了提示调整技术,以提高模型对新任务的适应性。目前,这项工作已经挂上了GitHub。据介绍,这项工作主要深入探讨增强图模型泛化能力的策略(特别是在训练和测试数据存在显著差异时)。而OpenGraph旨在通过学习通用的图结构模式,并仅通过前向传播进行预测,实现对全新数据的零样本预测。

......

感谢大家的关注,今天我们的分享就到这里。随着大模型技术的不断涌现,我们将有更多激动人心的进展和信息与大家分享。请继续关注我们的后续更新,获取最新的资讯动态。期待在不久的将来再次与大家相会,届时我们会带来更多精彩内容。祝大家有个愉快的五月,我们下期再见!