代码
“互联网+”获奖项目专访 | 国产全流程无人智慧育种分享

“互联网+”获奖项目专访 | 国产全流程无人智慧育种分享

“互联网+”获奖项目专访 | 国产全流程无人智慧育种分享

在本届“互联网+”创新创业大赛中昇思MindSpore“AI+BI”智慧育种团队荣获全国总决赛铜奖。本期有幸邀请到团队负责人王振邦和指导老师荣毅进行采访一起来看看夺奖背后的故事吧。

PART ONE

团队介绍

“AI+BI”智慧育种团队

1.项目成员

王振邦、黄福伟、龚念如、李勇兵、周云飞、闫垚楠

2.指导老师

熊盛武、荣毅

3.顾问

夏志强、赵龙

4.学校

武汉理工大学

5.团队简介

主要由武汉理工大学计算机与人工智能学院的学生和老师组成,团队成员有黄福伟博士、龚念如、周云飞、李勇兵和闫垚楠硕士,主要指导教师是武汉理工大学计算机与人工智能学院院长熊盛武教授和崖州湾种子实验室荣毅博士后,同时我们与海南大学热作院达成合作,邀请夏志强副院长和赵龙博士作为我们在生物信息领域的顾问。

PART TWO

项目访谈

项目名称

基于昇思MindSpore的全国产化农作物分子育种智能预测产业链

获奖情况

2022第八届中国“互联网+”大学生创新创业大赛 全国总决赛铜奖

Q1 为什么选择这个赛题?

我们本次的参赛项目是一个有一定研究基础和成果的农作物育种系统,而我们本次选择的赛题是产业命题赛道中华为公司提出的“基于昇思MindSpore的开发领域智能化创新解决方案”,其命题内容如下:

对于这个命题我们提取了“昇思MindSpore“和”智能化“两个关键点,其既是赛题的要求也是我们选择此赛题的理由,下面我将针对这两点分别介绍。

国产深度学习框架-昇思MindSpore

正如答题要求中所写的”必须使用昇思MindSpore框架“,我们项目中的预测模型完全基于昇思MindSpore进行开发,而选择它的原因也分两点:

①我们的系统在训练和实际应用中使用的农作物种源数据属于国家战略性资源,为了保证种质数据的绝对安全同时避免使用国外软硬件带来的泄漏风险,在立项之初我们的指导教师之一,崖州湾种子实验室的荣毅博士后就明确要求系统的全流程都需要实现国产化。

而对于我们的育种系统而言,AI预测模型是最核心的模块,因此我们对各种国产深度学习框架进行了深入研究与分析,最终选择使用在权威评测机构SGS实验室的安全评估中获得全球首个AI框架CC EAL2+证书的昇思MindSpore来开发模型,其能够为种质数据安全提供充分保障。

②我们的另一位指导教师熊盛武教授长期以来都在为推广和发展国产软硬件而努力,因此他与华为公司的合作十分密切。在过去的一年的时间里熊老师带领我们实验室的同学参与开发了150余项MindSpore社区发布的众智项目,累计培养了30余名昇腾众智金质量奖获奖者,同时他在平日的组会里也经常强调发展这样一个国产深度学习框架的重要性,因此我们团队的成员实际上都是非常熟悉昇思MindSpore的,具备足够的能力以及意愿来基于MindSpore开发模型。

全流程无人智慧育种-智能化

目前美国等种业强国正迈入使用“生物技术+人工智能+信息技术”的育种“4.0”时代,而我国仍停留在使用传统耕地育种模式的”2.0”时代。为此我们开发了农作物育种系统来精进我国育种技术,其能够通过种子基因数据预测出农作物成熟后的株高、产量等信息并据此筛选出优质种质,让农民在种下种子的时候就能确保有个好收成,同时大大节省育种时间和成本,解决耕地育种费时费力又费地的问题。并且我们从基因测序到最后生成育种建议报告的过程都可以在无人全自动环境下进行,实现全流程智能化。

综合以上两个关键点的分析,可以看出我们本身研究的项目非常贴合本次所选赛题的要求,因此我们选择了这个赛题,同时对照着赛题定下了我们的项目名“基于MindSpore深度学习框架的农作物分子设计育种表型预测系统”以及项目目标“打造出一条基于昇思MindSpore的全国产化农作物分子育种智能预测产业链”。

Q2 请详细介绍一下参赛的项目。

我们的项目是“基于MindSpore深度学习框架的农作物分子设计育种表型预测系统”,其功能和作用可以概括成一句话:给我一把种子,我们能通过预测告诉你哪些种子更值得播种。

以上是我们项目的流程概述图,下面将按照这三个部分介绍我们的项目内容:

自动化种源获取---低成本基因测序技术

目前市场上有多种测序技术,它们各有利弊,但普遍存在着成本高昂、限制要求多等问题,测序技术市场迫切需要一种灵活定制检测位点的数量、低成本和自动化的高通量测序文库制备方法、易于操作的 SNP 分型平台用于下游数据的分析,来满足不同物种大规模测序分型的需求。对此,我们使用一种新的成本效益高,更加灵活自动化,且基于聚合酶链反应的高通量测序文库制备方法,它将服务于全球的动植物育种家,助力于现代育种业迈入大数据时代。

人工智能模型表型预测---昇思MindSpore与昇腾Ascend

MindSpore是一个全场景深度学习框架,旨在实现易开发、高效执行、全场景覆盖三大目标,其中易开发表现为API友好、调试难度低,高效执行包括计算效率、数据预处理效率和分布式训练效率,全场景则指框架同时支持云、边缘以及端侧场景。我们将农作物的生物特征信息及其种子经过测序技术提取出的基因信息作为训练数据,基于昇思MindSpore开发模型并在昇腾AI全栈平台上进行训练与推理,能够实现全国产化的系统搭建过程。

优势种质筛选---高精度GS预测模型

针对现有GS模型预测准确率差,模型运行效率低的问题,本项目基于深度学习算法,拟构建一种特殊的循环神经网络——长短期记忆神经网络(Long Short Term Memory network,LSTM),其能有效捕获作物基因性状蕴含的非线性时序结构特征,根据参考群体的SNP标记文件及表型文件训练LSTM预测模型,进而在仅提供基因型文件的预测群体上进行预测,以更高的预测精确度来估计育种值,提升早期优势个体选择效率。

项目总体技术路线如下:

本团队选择聚焦于农作物分子育种领域,依据基因测序技术自动化获取种子基因数据,基于MindSpore开发并训练深度学习模型,实现对优质种质的筛选,致力于打造出一条基于昇思MindSpore的全国产农作物分子设计育种智能化产业链。一方面推广国产深度学习框架,丰富昇思MindSpore社区,推动国产AI生态建设;另一方面实现全流程智能化育种,“真题真做”解决产业实际问题,助力我国育种技术向4.0时代发展。

Q3 介绍一下项目核心创新点在哪?****

高通量测序技术

项目采用的基因测序技术具有速度快、成本低、适用性强等优点,基因组的简化和条形码的添加只需一个带有特殊引物的扩增步骤即可完成,标记密度可以根据需要使用不同的引物进行微调,以低成本满足不同的需求,是基因分型方法中最简便和成本最低的。相比现有测序技术,建库时间降至1/4,成本减少50%以上并且适用于所有物种,可以快速获取大量高质量基因数据。

高鲁棒预测算法

项目将人工智能技术与生物信息技术相结合,构建“AI+BI”深度学习模型,其能有效地处理大数据,捕捉到数据中复杂的线性和非线性模式的拓扑结构,以及基因型数据中的非加性效应、复杂关系和交互作用,显著提高模型预测准确率和估计育种值有效性。

利用SNP位点时序信息,有效捕获基因性状蕴含的非线性时序结构特征,通过融合基因数据与生物特征信息来提升预测精度。与现有全基因组选择模型如线性预测模型、bayes模型和机器学习模型相比,本项目解决了现有模型无法适用于复杂多样的遗传性状、待估参数多计算量大和准确率有限等问题,模型预测准确率指标平均提升12%,最大提升16%。

Q****4 项目遇到的难点、痛点是如何解决的?

我们的项目主要遇到过数据、算法和开发这三个的难点:对于种源数据来源的问题,我们团队与崖州湾种子实验室和一些育种基地达成合作,借助他们提供的数据来训练我们的模型;对于优化算法的问题,我们向海南大学热作院寻求生物信息领域的咨询,主要解决种子SNP数据降维以及如何利用生物特征信息提高模型精度的问题;最后关于开发的问题,虽然我们团队对于MindSpore是比较熟悉的,但是在开发中也还是遇到了不少的问题,针对这些我们首先会在社区以及微信群里询问一些热心的开发者,如果遇到一些实在难以解决的问题我们也会联系社区的工程师进行询问。

虽然三个问题的内容不同,我们的解决方案其实都是很类似的,都是通过自身与其他院校或企业的合作来共同攻坚,而这也正是”互联网+“大赛所推崇的新工科新农科融合、多学科多院校交叉的合作新模式,实现了产学研结合。

Q5 请问你们****项目未来的应用场景是如何的?

我们的应用场景主要集中于农业生物育种领域,可以进行回交育种、进化分析、GS育种和遗传背景筛选等研究,也可以为各大科研机构、育种基地和科技公司提供育种分析表型预测等服务。

Q6 请****说一说使用昇思MindSpore的体验。

我们实验室也是参与了MindSpore从1.3到现在2.0版本的一个开发工作,对于MindSpore还是比较了解的,在长期的开发和使用过程中有如下几点体验:

易用

昇思MindSpore的使用教程和文档非常详细,官网上可以查到非常多的使用手册和wiki指南等等,同时MindSpore的公众号、“小猫子”和“吴彦祖”基本上每天都会分享一些技术博客,在B站上也是经常举行一些直播活动,会邀请一些社区优秀开发者和工程师来讲解一些使用MindSpore进行开发的技巧,所以对于想要加入MindSpore社区的同学们来说是非常友好的,这些丰富的学习资源也让昇思MindSpore十分容易上手。

能用

目前基于昇思MindSpore搭建的模型仓库ModelZoo里面已经有非常多的各领域经典和SOTA模型了,并且算子也基本上和友商对齐了,已经能够满足深度学习模型开发的所有需求了,大家可以尝试使用昇思MindSpore来复现一些自己读过的论文或者直接用MindSpore来开发自己的模型了。同时关注MindSpore公众号的同学应该也会发现基本上隔几天就会有新的企业或研究机构加入昇思MindSpore社区的推文,这也从侧面证明了目前MindSpore深度学习框架早已超越了“能用”的标准。

好用

作为昇思MindSpore一年多的开发者和使用者,目前感觉MindSpore还没有到非常完美的程度,在使用中还是会遇到一些报错不清晰和性能不足的情况,对于纯粹的使用者可能还是有些阻碍。但正是因为我们有开发者这层身份,所以很清楚的知道这一年的时间里,社区对于MindSpore的代码合入质量要求越来越严格,并且组织了很多SIG来分领域精准提高用户体验。我相信在众多开发者和管理者的共同努力下,MindSpore能够成一个好用并且大家都愿意用的深度学习框架。

我希望MindSpore能够继续发展完善,吸引更多的开发者和使用者,如果未来出现AI框架受到限制或封锁的情况,我期望MindSpore能够作为一个能用易用好用的深度学习框架继续支撑我国人工智能产业的发展。

Q7 在参与互联网+”比赛中有什么收获和经验?

把握赛道重点

“互联网+”大赛有很多的赛道,而每个赛道的侧重点都是不同的,比如我们参与的产业命题赛道中,团队接题后与命题企业之间的合作历程占了很大的分值,所以需要突出与企业共同商讨攻克难题的这样一个过程。对于其他的赛道也会有不同的重点,大家需要注意。

体现教育维度

近几年“互联网+”大赛非常强调项目在教育维度的内容,今年的占比更是达到了30%,因此大家在撰写项目计划书和做ppt时需要考虑和凸显项目在引领教育和带动就业这两个层面的优势。

补齐项目缺口

每届“互联网+”大赛都有对应的评分准则,其中每一条都对应着一定的分值,切忌缺项漏项。大家可以对着准则一条一条的检查,缺哪条就想办法补哪条,就算有一些条目无法取得很高的分值也一定要体现出来,因为比赛不是考试,并不存在正确答案,只要体现出来了就会有分,如果你不写就相当于别人满分100分你的满分只有90,80分,那自然比不过。

PART THREE

导师访谈

熊盛武

**熊盛武,**武汉大学计算机软件与理论工学博士,二级教授,武汉理工大学计算机与人工智能学院院长,湖北省人工智能产业链专家咨询组专家,武汉市人工智能创新发展专家咨询委员会专家,海南省首批双百团队负责人,教育部“深度学习课程虚拟教研室”负责人。

承担主持863计划、国家重点研发计划、国防基础研究和国家自然科学基金等项目的研究,获省部级教学和科研成果一等奖2项,二等奖5项。近三年深耕基于人工智能和大数据的分子设计育种新技术研发与创新。参与七大作物育种重大专项课题,负责品种分子设计育种云平台的建立;参与“神农”作物表型组大科学装置研究,负责智能数据分析。

在IEEE/ACM Transactions期刊TIP,TKDE, TITS,TGRS,TALLIP,TCBB等和AAAI,ICCV,COLING,ACM MM,BIBM,ICRA,ICASSP,INTERSPEECH等会议发表论文50余篇,获得国家发明专利授权15项。

荣毅

**荣毅,**武汉理工大学计算机学院博士后,海南崖州湾实验室联合项目博士后,现主要致力于将图像处理与人工智能技术应用于农业表型数据及基因型数据关联分析方面的研究。

曾在权威学术期刊IEEE Transactions on Image Processing、Pattern Recognition及AAAI、ACCV、ICIP等重要学术会议上发表论文8篇,申请国家发明专利2项。曾参与国家863计划、国家重点研发计划、国家自然科学基金等课题的研究工作,并主持海南省自然科学基金联合项目一项。

曾任2021年第七届中国国际“互联网+”创新创业大赛湖北省金奖项目负责人,2022年第八届中国国际“互联网+”创新创业大赛湖北省金奖项目指导老师。指导学生参与2022年首届“崖州湾杯”科技创新大赛获南繁赛道一等奖、最佳成果转化奖,并获评最佳指导老师。

Q1 请老师谈谈陪伴学生参加本次比赛获得佳绩的心路历程。

作为指导老师全程参与了本次“互联网+”比赛从校赛到省赛最终到国赛入围的全部流程。起初,参与本次“互联网+”大赛的主要目的是锻炼本团队同学们在工作中发现与解决问题的能力,加强本团队与湖北省其他高校研究生的思维碰撞,也向其他学校竞赛项目学习取经,争取吸取他们的成功经验纳为己用。

后来,随着比赛的进行,在另一位指导老师熊盛武教授的悉心指导下,我和团队成员对参赛项目进行不断打磨,不断优化技术方案,提升成果应用价值,同时也不停精进路演PPT与演讲稿,一遍又一遍地进行答辩演练,最终才拿到了这次湖北省金奖的好成绩。

其实,参与本次比赛的过程并非一帆风顺,期间遇到了如更换选题,技术方案结果不佳,疫情影响等一系列的挫折与困难,但是本团队成员们都迎难而上,共同努力,克服了这些难题,本次比赛的结果就是对他们长时间以来工作的嘉奖与肯定。

Q2 老师有什么想对自己学生说的?

团队中的许多同学还没有研究生入学时就已经与我共同合作开展工作了,在工作中我们是师兄弟,在生活中我们是好朋友,他们的点滴成长我们都共同经历。

一年多以来,在工作中无论遇到什么困难,同学们都积极地去面对与克服,无论是MindSpore开发,学术研究,还是各类双创学术竞赛,他们都积极参与且收获满满。而王振邦同学从初入学一个不太擅长写代码的大四学生成长为现在的MindSpore布道师,从当年双创比赛站在我身旁默默展示PPT的辅助人员成长为现在“互联网+”省金奖项目的负责人在讲台上侃侃而谈,都离不开他的不懈努力。

同时,他对工作的热情与活力也鼓励着我不断前进。对同学们我想说,一方面祝贺你们已经取得的成绩,为你们的进步与成长感到骄傲,另一方面也希望你们在未来工作中能继续脚踏实地,不断提升与完善自身各方面能力。

看完上面的分享,相信屏幕前的小孢子们也一定收获满满吧!付出终究带来收获,“AI+BI”智慧育种团队越走越远,越走越稳,最终取得了辉煌成绩。

本期采访就到这里,下一期内容更精彩,速速关注我们吧!