提速近10倍!基于深度学习的全基因组选择新方法来了******
近日,中国农业科学院作物科学研究所、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法, 可以实现育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。相关研究成果发表在《分子植物(Molecular Plant)》上。
全基因组选择作为新一代育种技术,通过构建预测模型,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。
统计模型作为全基因组选择的核心,极大地影响了全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。
相较于传统模型,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机,深度学习算法的优化将会提高全基因组选择的预测能力。
该研究团队以玉米、小麦和番茄3种作物的4种不同维度的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法。
与其他五种主流预测方法相比,该方法有以下优点: 可以利用多组学数据开展全基因组预测;算法设计中包含批归一化层、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度;预测精度稳健,在小型数据集上的表现与目前主流预测模型相当,在大规模数据集上预测优势更加明显;计算时间与传统方法相近,比已有深度学习方法提速近10倍;超参数调整对用户更加友好。
该研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目的支持。
学术支持
中国农业科学院作物科学研究所
记者
宋雅娟
阿尔泰山脉雪豹种群质量稳定向好******
今年元旦期间,新疆阿勒泰市将军山滑雪场及周边区域出现一只雌性、一只幼体两只雪豹,引起社会各界广泛关注。
“雪豹现身地为该度假区雪场金光道,海拔约1000米,雪豹被滑雪场工作人员拍摄到。”阿尔泰山国有林管理局野生动植物保护处处长马木尔别克·马看介绍,此次雪豹向山下迁徙,主要是因为2022年年底降雪量大,厚厚的积雪完全把雪线上的植被覆盖,山上的北山羊、马鹿、狍子、野兔等草食动物被迫往海拔较低的地方垂直迁徙觅食,以北山羊等动物为主要食物的雪豹也就跟着到海拔较低的地方捕食,将军山区域成为其临时停歇地。这也说明,阿尔泰山脉的雪豹种群质量正稳定向好发展。
阿尔泰山是亚洲中部横跨中国、俄罗斯、蒙古和哈萨克斯坦四国的大型山系之一,它是额尔齐斯河发源地,是具有全球意义的生物多样性的中心区域之一;是许多珍稀濒危动物的主要分布区;拥有从荒漠草原到冰雪带的完整山地垂直自然景观,以及数量众多的湿地、河流和湖泊。复杂的地形地貌、独特的地理区位,为各种野生动物的生存和发展提供了良好条件,是新疆野生动植物多样性最丰富的地区之一,也是连接我国天山雪豹种群与蒙古、俄罗斯以及哈萨克斯坦境内的雪豹种群之间交流的主要通道,对于全球雪豹保护至关重要。
近年来,阿尔泰山国有林管理局全面落实野生动物保护措施,不断加大阿尔泰山野生动物及其栖息地保护力度,全方位开展野生动物保护宣传,通过红外相机布设、管护员日常巡护、高山监控、道路卡口一体化监测体系等手段,建立了雪豹长期监测网络,获取了雪豹的大量数据和影像资料。2017年至今,阿尔泰山林区已发现18只雪豹,其中大部分是通过红外线相机拍摄到的。目前,当地已初步建立了雪豹长期监测网络,获取了大量数据、影像资料。仅2017年至2022年,阿尔泰山两河源自然保护区管理局在富蕴县辖区就先后拍摄到雪豹影像资料400余份。
1月5日,阿尔泰山国有林管理局、阿勒泰地区林草局和阿尔泰山两河源自然保护区管理局联合行动,针对雪豹的习性和附近地貌特点,在雪豹可能出现的活动区域内架设3台红外相机,持续监测雪豹的活动轨迹。
“在阿尔泰山脉东南部、中西部和西北部持续拍到雪豹和大量其他野生动物,说明阿尔泰山脉区域有着一个相对稳定的雪豹种群以及完整的生态系统。阿尔泰山国有林管理局将持续开展雪豹监测调查,为保护该区域的雪豹及其高山生态系统提供了重要的科学依据。”马木尔别克·马看说。
(光明日报记者 李 慧 赵明昊)
(文图:赵筱尘 巫邓炎)