大数跨境
0
0

水稻育种 | Rice3kGS:支持水稻大规模基因组选择的高性能在线平台与数据库系统

水稻育种 | Rice3kGS:支持水稻大规模基因组选择的高性能在线平台与数据库系统 基预科技
2025-05-14
1
导读:基因组选择(Genomic Selection, GS)作为现代作物育种的核心技术之一,显著提升了遗传改良效率,但其应用仍面临训练群体构建成本高、模型泛化能力不足等问题。针对这一挑战,中国科研团队开发

基预科技单细胞全栈方案-让研究不再有距离

单细胞悬液制备|工程师精准匹配|个性化深度分析

详情请看:

基预科技单细胞全栈方案——让研究不再有距离





导语

基因组选择(Genomic Selection, GS)作为现代作物育种的核心技术之一,显著提升了遗传改良效率,但其应用仍面临训练群体构建成本高、模型泛化能力不足等问题。针对这一挑战,中国科研团队开发了“Rice3kGS”网络平台,通过整合3,000份水稻种质资源的基因组与表型数据,并结合优化的机器学习算法,为大规模基因组选择研究提供了高效工具。该平台不仅集成了多源数据集和先进分析功能,还支持用户自定义模型构建和精准筛选优异种质,为水稻复杂性状遗传改良开辟了创新路径。

公众号发送”我要导图“即可获取高清导图

image.png

Figure 1 思维导图



要点

传统表型选择依赖田间观察,耗时耗力且受环境干扰显著,而基因组选择通过利用分子标记实现早期预测,成为智慧育种的重要方向。然而,现有方法在跨环境预测精度、数据类型兼容性等方面仍存在瓶颈。为此,研究团队聚焦水稻这一关键粮食作物,基于国际水稻研究所3,000份基因组计划(3KRG)的种质资源库,构建了覆盖56个重要农艺性状的超10万条表型数据记录,涵盖产量、品质、抗逆等六大类别。基于此,研究目标明确:开发兼具高效预测能力和用户友好性的GS工具,推动水稻育种的智能化与标准化。

image.png

Figure 2 Rice3KGS 的构建框架与工作流程


研究核心围绕三方面展开。首先,针对现有GS模型预测稳定性不足的问题,提出了创新性的LGBMY算法。该模型在LightGBM框架基础上引入贝叶斯优化策略,通过动态参数调优显著提升了泛化能力。验证实验显示,对千粒重(TGW)、耐热性(HT)等七个性状的预测精度较原始LightGBM平均提升5.2%(P<0.05),均方根误差(RMSE)降低3.1%;与gBLUP、XGBoost等七种主流模型相比,平均精度优势达10.7%。特别是在时空调控复杂的表型(如HT)中,LGBMY表现出最佳稳定性,验证了其对于环境互作效应的适应性。

其次,平台构建了多层次数据资源体系。基因型方面,整合包括40.4万核心SNP、短串联重复序列(STRs)及结构变异(SV)在内的七大分子标记数据集,同时提供基因存在-缺失变异(PAV)信息;表型端则通过多环境BLUP值校正基因型×环境互作偏差。尤为突出的是“亚群特异性训练集”模块:基于籼稻(Xian)、粳稻(Geng)和奥斯稻(Aus)的系统发育关系定义六类亚群,用户可根据目标群体遗传背景选择最优训练集。对比试验表明,同一亚群内预测精度(如粳稻内达0.49)显著优于跨亚群预测(如Aus预测非Aus群体精度仅0.13),证实了遗传距离对模型性能的关键影响。

最后,平台设计了高度灵活的功能架构。用户可自定义选择训练群体(如籼粳混合或特定亚群)、匹配表型性状(单性状或多性状协同预测),并从八种预测模型中优化组合(包含传统gBLUP、机器学习融合模型MFMGP等)。进阶功能中,“优异种质筛选”模块支持按育种目标自动筛选Top-N株系,而“私有化定制”接口允许用户上传本地数据构建个性化模型。典型案例分析进一步验证了基因型数据类型的模型依赖性:对于粒型等遗传力较高的性状,STR标记相较于传统SNP可提升预测精度达18.7%(P<0.01),暗示着遗传结构解析精度的提升对GS效能的重要性。



小结

Rice3kGS的推出标志着水稻基因组选择从算法研发向平台化服务的跨越。其核心价值体现在三个方面:① 整合多维度数据的开放性资源库,突破传统研究中数据孤岛限制;② LGBMY等创新算法为复杂性状解析提供新范式;③ 亚群驱动的定制化策略显著增强模型实用价值。然而,平台当前局限包括部分表型数据的环境覆盖度不足,以及SV等新型标记的应用案例待丰富。未来研究需强化多组学数据融合与轻量化部署能力,并探索云端协作模式以降低用户计算门槛。该工具为水稻乃至其他作物的精准育种奠定了重要基石。



文献来源

Zhang, C., Cui, Y., Yuan, C., Zhang, F., Zhu, Q., Li, S., Zheng, S., Zhou, S., Sheng, T., Qiu, X., Liang, Q., Yu, Y., Wang, W., Li, M., Rice3kGS: a powerful web platform and database for large-scale genome selection, PLANT COMMUNICATIONS (2025)

【声明】内容源于网络
0
0
基预科技
1234
内容 1211
粉丝 0
基预科技 1234
总阅读3.2k
粉丝0
内容1.2k