喜讯 | 百奥云联合河北农林科学院在Plant Com发表绿豆泛基因组研究成果
公司动态
2022-07-01
01 INTRODUCTION成果简介
绿豆作为重要的经济作物,在我国种植时间已有2000年。绿豆不仅是重要的淀粉和蛋白质来源,还因其富含牡荆素和异牡荆素等黄酮类活性物质,具有抗氧化、抗肿瘤、抗病毒和降血压血脂等多种生理功效,在中国和东南亚地区是重要的药用植物。研究表明,绿豆清热解毒的作用主要活性成分即为牡荆素和异牡荆素。此外,绿豆芽也是一种重要的蔬菜。近年来,随着植物蛋白产业的兴起,绿豆作为优质的植物蛋白(蛋白质含量25-28%),因其清蛋白的氨基酸模式与人体接近而备受关注。
相对于主流作物而言,绿豆的分子育种比较落后,具体表现在:没有高质量参考基因组,没有覆盖全基因组范围的高密度分子标记,对绿豆群体遗传多样性了解不足,鲜有可供育种选择应用的候选位点,以及对绿豆的蛋白含量、淀粉含量、牡荆素合成等重要农艺性状的遗传机制了解甚少等等,这些都严重限制了绿豆的分子育种和遗传改良进程。
河北省农林科学院粮油作物研究所田静团队与百奥云团队开展深入合作,应用第三代测序方法对生产上一个主栽绿豆品种(冀绿7号)进行了测序,组装了染色体级别的高质量参考基因组。我们还对217份绿豆资源材料进行了重测序,构建了首个绿豆泛基因组和全基因组变异图谱,鉴定出覆盖全基因组范围的高密度分子标记,并首次利用高深度测序鉴定到的SNP和PAV对33个重要农艺性状进行全基因组关联分析,发掘出一系列与产量、品质(如蛋白、淀粉、牡荆素、异牡荆素等含量)、抗性等性状相关的重要候选基因。
2022年6月26日,该研究成果发表在国际期刊Plant Communications上(影响因子为8.625,JCR Q1)上,为绿豆的遗传本底解析、分子育种改良和工业化应用提供了重要的数据支撑和理论指导。百奥云作为合作单位深度参与了此研究,王冰冰博士和彭建祥分别为该论文的共同通讯作者和共同第一作者。
02 RESEARCH CONTENTS研究内容
研究首先利用三代测序技术对绿豆优良品种“冀绿7号”进行基因组从头组装,大小~ 475.19 Mb,预测出40125个蛋白编码基因。Contig N50达10.34 Mb。99.66%的二代测序reads能够比对到参考基因组上,BUSCO得分98.02%,LAI score为15.67,这是迄今为止质量最高的绿豆参考基因组。近缘物种的基因家族聚类发现,绿豆特异的基因家族主要与淀粉和糖类代谢、氨基酸合成相关,与绿豆中丰富的淀粉和蛋白含量一致。而扩张的基因家族富集在异黄酮生物合成以及萜类合成等通路,或许与绿豆丰富的类黄酮物质有关。这些绿豆的生物学特征解析为后续绿豆蛋白、黄酮类活性物质(如牡荆素、异牡荆素)等研究和应用提供了基础。
图1 绿豆基因组组装与比较基因组
研究首次对217份绿豆种质进行全基因组重测序,平均测序深度12 x,共鉴定到高质量的~2.23 M SNPs以及一系列结构变异。多样性分析表明,来自中国南方的材料多样性高于北方材料,可能是引种过程中,遗传基础变窄所致。通过与533份公共材料的GBS数据合并,系统分析了来自全球23个国家750份绿豆的遗传多样性,发现东亚与南亚的绿豆材料具有明显差异。南亚材料的多样性最高,这与之前绿豆起源于南亚的观点相吻合,推测可能通过丝绸之路由南亚引进到西亚和东亚,并在东亚形成独特的次多样性中心。这些研究为绿豆的分子标记开发,以及不同地区的引种改良提供了重要的指导。
图2 绿豆全基因组变异图谱及群体遗传研究
通过对217份绿豆种质分别进行组装,构建了首个绿豆泛基因组,其大小~763 Mb,共43462个预测基因。绿豆泛基因组由76.5%的hardcore genes、6.6%的softcore genes、16.5%的shell genes和0.4%的cloud genes组成。核心基因的功能与基础生物学过程息息相关,可变基因则涉及生长发育调控、环境胁迫响应等功能,因此可变基因在绿豆适应不同环境过程中发挥着重要作用。而且,可变基因在基因组中的分布包含了某些热点区域,这些可能是绿豆适应性选择的重要潜在位点。根据基因在不同亚群中的频率分布,筛选出9个与开花调控相关的gene PAV事件。
图3 绿豆泛基因组构建
研究进一步调查了217份材料的33个重要农艺性状在两地、两年和春夏两季共6个环境的表型。基于SNP的GWAS分析显示,几乎所有性状在至少一个环境中鉴定到显著关联信号(STAs),2912个STAs包含了位于转录区域的248个基因。多个性状的STAs聚集在1、4、7号染色体上的热点区域,它们可能与绿豆的驯化选择有关。此外,基于gene PAV的关联研究共鉴定到391个PAV显著关联事件,这些信号与STAs具有较高的一致性,能够作为SNP GWAS的有力补充。
图4 基于SNP和gene PAV的GWAS结果概览
GWAS结果鉴定了一系列与产量、抗性、颜色、株型等性状的候选位点,并能在大豆等近缘物种中找到对应的同源基因。例如,候选基因jg24043可能同时调控了绿豆籽粒中的蛋白和淀粉含量,其在大豆中的同源基因SWEET10已被证实与籽粒大小调控、脂肪和蛋白含量有关。一段包含11个基因在内的大小为136 Kb的PAV,控制绿豆的花、花蕾、幼茎、叶柄等颜色,其中的基因与大豆调控花青素合成的R基因(Glyma.09G235100)具有很高的同源性。这些候选基因为绿豆分子育种改良提供了重要基础。
图5 淀粉/蛋白和颜色相关性状的GWAS示例
03 ANALYSIS数据分析
百奥云在动植物领域为客户提供专业并全面的生物信息和育种数据分析,包括但不限于以下内容:
基因组组装:基因组Survey,De novo,基因组注释,泛基因组,比较基因组,数据库等;
基因定位与克隆:分子标记开发,遗传图谱构建,BSA,QTL-seq,GWAS等;
群体遗传:变异检测、群体结构分层,PCA,进化树,遗传多样性,遗传距离,基因流等;
多组学:转录组,蛋白质组,代谢组等;
基因组选择:模型构建与验证,杂交种预测,自交系预测等;
育种数据分析:试验设计,育种值,遗传力,配合力,遗传评估,方差分析,回归分析等。
欢迎各位老师与专家垂询!
0731-85653208
上一篇:
相关推荐
百奥繁育 | 良种选育的信息管理系统
8月25日,江西省水稻种质资源创新交流及智能育种技术研讨会在江西省农科院顺利召开。江西农业大学、江西师范大学、广东省农科院、江西省农科院、中国水稻所江西早稻中心、南昌市农科院、赣州市农科所有关专家代表以及省内种企代表共约40人参与了本次交流会议。
有人说,植物育种的过程就像工厂流水线。挑选的种质即原材料,根据市场需求进行设计与加工,送入田间生产线后,一代代优中选优,还得经过严格的产量、品质、抗性测试,过五关斩六将,最终拿到审定编号,成为可以推广的成熟产品。 虽然流程相似,但育种工作远不及工厂生产那样标准。田间环境气候复杂、真实性状判断困难、水肥条件难以统一……种种困难下,选育良种成了概率事件,育种家们都有种“尽人事听天命”的无奈感。
育种4.0时代,比拼的是科技创新,关键是通过数字化、信息化、智能化让育种过程缩短周期、提升效率、降低风险,而这也是长沙百奥云数据科技有限公司(百奥云)的创业初衷。
1. 利用PopGenomics快速对基因组实现高质量组装 基因组组装是将全基因组测序的小片段(reads长度100 bp-100 kb)通过算法拼接成尽量长的片段(contig 和scaffold,长度几十kb 到Mb 不等)或者整条染色体的过程。获得包含基因组全序列的参考基因组是对动植物进行基因组学研究和育种利用的前提[1]。 由于植物基因组具有非常丰富的多样性,参考已发表的少数物种组装新的物种,有时却无法达到理想的组装效果。测序技术发展提供了短序列测序、单分子测序、光学图谱、Hi-C 图谱等多种测序技术及其组合的组装方案,到目前为止,已经有上千个植物基因组被组装(图1)。然而,如何以最低成本快速获得满足需求的高质量基因组,仍然是科研人员和育种数据分析人员普遍面临的一个问题。
7月26日,顶着炎炎夏日 在公司CSO桂進老师的带领下 举行了一场别开生面的劳动体验。