近日,由我校生命科学学院2022级生物科学国家理科基地班、2022级生物科学拔尖计划2.0基地班本科生共同组建的研究团队在植物表型组学研究领域取得重要进展,相关研究成果以“A computer vision-based approach for high-throughput automated analysis of Arabidopsis seedling phenotypes”为题,在植物生理学领域主流学术期刊《Plant Physiology》上刊发。该期刊由美国植物生物学家学会(American Society of Plant Biologists)主办,创刊于1926年,是国际公认的植物生理学研究领域顶级学术刊物和中国科学院1区杂志。

植物幼苗表型分析是基因功能与信号转导研究时常用的技术手段。传统的基于ImageJ软件的手动测量方法存在效率低下、难以实现动态分析等痛点问题。针对这些问题,研究团队运用深度学习,开发出一套相对高效、准确的植物动态表型分析解决方案。
该研究通过整合目标检测与语义分割算法,成功实现了拟南芥幼苗在远红外成像条件下的多器官识别与形态参数提取。研究团队在北京麦科伦科技有限公司纪玉锶博士和南方科技大学彭旸博士的帮助下构建了包含多种拟南芥突变体的数据集,并通过Swin-Transformer架构、focal loss损失函数等进行模型优化,显著提升了复杂生长环境下的图像分割精度(图1)。相较于传统方法,团队开发的分析流程可自动识别并排除幼苗重叠的干扰;支持超高分辨率图像的并行处理;能够同步分析下胚轴、子叶、叶柄等多器官的形态动态变化。

图1 通过消融实验逐步优化模型结构,提高计算准确度
生命科学学院2022级本科生万仲翔(生物科学国家理科基地)为论文第一作者,2022级本科生孔伟绩(生物科学拔尖计划2.0基地班)、汤妍(生物科学国家理科基地)、马飞翔(生物科学拔尖计划2.0基地班)三位同学以同等贡献参与该项工作,生物科学拔尖计划2.0基地专业主任、生命科学学院植物所副所长朱自强教授为论文通讯作者,南京师范大学为第一完成单位。
孔伟绩、万仲翔、汤妍三位同学入选我校2023年度本科生“英才培养计划”(A类),这项工作完全由四位2022级本科生同学在导师指导下独立完成。多年来,我校高度重视生物科学拔尖人才的个性化培养,根据学生特长,安排校内外专家进行指导,将机器学习与传统植物生理学研究有机结合,这项工作的发表也是近年来我校在生物科学拔尖创新人才培养方面取得的标志性成果之一。
论文链接:https://doi.org/10.1093/plphys/kiaf275