智能育种

您身边的育种数据管理分析

答疑汇总 | 百博智慧大讲堂报告——“基因组选择”问题回答Vol.01

动态

2022-03-15 00:00


  【百奥云】2022年2月23日,我们邀请了美国SSM健康医院系统首席数据科学家钟声强博士,现场气氛热烈,大量问题在互动过程中没有时间回答,于是后期我们收集提问向钟博士请教并整理回答内容,现将回答内容分为三期与大家分享,敬请关注!鉴于有些问题想了解国际种业公司GS应用的一些情况,钟博士对此类问题均没有回答,因此我们在其回答的原文里略有删节,但保留了所有干货。

  钟博士在报告里提到了GS联合学习,引起了不少听众的兴趣。欢迎有意了解更多细节的朋友跟百奥云联系,共同探讨如何拓展数据维度,提高GS预测精度。

 

 

  【钟博士】根据 Meuwissen 提出的近似方法, GS分子标记的密度大约有10 * N * L 就够了。N 是有效的群体数目,L 是总遗传长度, 单位是摩尔根。玉米的基因组大约是18 个摩尔根。 假设基因组选择是在家系内进行的话,N 就是2, 那10*2*18 = 360 个均匀分布的标记就够了,也就是说每5 个cM (1800 cM/360)一个多态性标记就够了。明尼斯达大学的Rex Bernardo教授,基因组内选择的研究发现也跟这吻合。以此可类推到其他作物中,即在家系内GS, 5 个cM一个多态性标记就够了。假设基因组模型构建在不同家系群体中的话,要估计一下N。这个可以用父母本群体中连锁不平衡r2来反推出有效的群体数目:E(r2)=1/(4Nc+1)。更多信息可见:

 

文章链接:https://www.ans.iastate.edu/files/page/files/notes.pdf

 

 

  假设在1 cM处的平均r2 是0.45, 则可反推出 N = (1/r2-1)/4/0.01 = 30, 这样的话,就可推出大概10*30*18 = 5400 个分子标记就够了。这就是分子标记在父母本群体中的密度。只要父母本有高密度,子代的密度就像家系的密度,比如360 个就够了, 因为可以用imputation 到高密度。这些在文献中可见, 比如:

 

文章链接https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2674831/

 

 

 

文章链接:https://acsess.onlinelibrary.wiley.com/doi/abs/10.2135/cropsci2017.11.0682

 

 

 

文章链接:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3931944/

 

  不考虑互作效应的GS模型, 理论上预测的是广适应性的育种值。 利用多个地点来源的训练群体, 也有利于构建GS模型,从而选择广适应性的育种值。

 

 


相关推荐

新品发布 | 百奥云推出基因组局部组装服务

百奥云基于二代/三代测序数据以及中间结果文件(如fq/bam),自研局部组装算法与流程,并结合了大数据产品基因云湖(GenoLake)的海量数据管理、查询与分析等功能,为用户提供个性化的局部组装服务。通过百奥云的局部组装方案,用户可以快速获取基因/蛋白全长序列信息,避免传统实验所带来的时间和资源浪费,加快决策周期,提高研究和生产效率。同时,还可有效地解决大规模测序数据存储、查询和分析等问题,提高数据利用率,获取更全面的基因组信息,助力动植物研究和育种生产的顺利进行。

04-07

2024

AI大数据 | 百奥云育种数据科学家顾林林发表一种高效精准的集成学习基因组选择方法ELPGV

是否存在一种方法可以整合各种模型的结果以期望获得更加精准的预测呢?

04-03

2024

百奥云为南繁种业发展注入新动力,水稻基因体检服务首次参展

百奥云本次大会携水稻基因体检服务首次参展,诚邀各位专家、老师及同仁共同探讨探讨未来农业发展的新趋势和技术创新。

03-21

2024