育种专栏 | 6-基因分型新技术:FBI-seq

前沿分享

2022-10-28


小编本来计划这周介绍基因分型之靶向测序技术,不想近日了解到中国农科院深圳农业基因组研究所常玉晓老师最新研发的基因分型技术——FBI-seq:A prolific and robust whole-genome genotyping method using PCR amplification via primer-template mismatched annealing,因此先和大家一起来了解这项新鲜出炉的技术。

    FBI-seq发现

  FBI-seq(Foreground and Background Integrated genotyping by sequencing),不是美国联邦调查局测序,而是整合前景与背景的基因分型测序。顾名思义,该项技术实现了对前景基因和遗传背景同时进行了检测和选择。前景与背景的选择在分子育种中是两个非常重要的步骤,目前育种家们往往需要分开独立地进行这两步:即首先筛选前景目标位点,然后开发大量的探针/诱饵/PCR引物进行背景基因型的检测,这些耗时长与高投入成本的准备工作大大延迟了育种项目的启动。

  一般而言,我们设计PCR引物进行基因型检测时往往希望扩增产物是具有特异性的,即只在基因组的某个位置发生,这样才能精准地对目标位点进行检测。但是非特异性的扩增在PCR反应中是普遍存在的,人们通常利用优化引物设计、PCR反应体系等方法来减少或抑制非特异性扩增。这项研究反其道行之,研究了如何增强非特异性扩增。之前的观点认为,非特异性扩增是由引物在其同源或部分同源位点退火引起,一般数量较少。本研究意外发现,任意PCR引物,除了其引物与DNA模板间完美匹配(Primer-Template Perfect Annealing, PTPA)的位点外,在基因组上存在着数以万计的引物与DNA模板间不完美匹配(Primer-Template Mismatched Annealing, PTMA)的位点,而且PTMA的扩增是稳定、可重复的。基于这一意外发现,研究人员开发了FBI-seq。

  FBI-seq流程

  为了高效分离已知DNA片段侧翼的未知序列,常老师团队早前已经研发出侧翼序列标签测序方法(FST-seq)。FST-seq使用特定的巢式引物退火来获取目标序列以及由Tn5转座酶添加接头。起初研究人员是想利用不同转座子通过Tn5转座酶进行高效的接头连接,通过扩增大量的FSTs作为分子遗传标记,而非像常规研究那样每一个位点都需要设计对应的引物来扩增。

  在分析测序数据时,由于无意中使用了与Rim2转座子的引物,而不是原本的巢式引物,他们意外发现了三种类型的reads。每种类型的reads都不同,因为从read1开始的序列是唯一的,而且当多条reads比对到相同区域时,就形成了标签(tags)。第一类PTPA reads/tags占1.1%,从Rim2引物序列开始(FBI-Rim2),在离转座子约350bp处结束。第二类PTMA占43.8%,其模式与PTPA相似,但在read1的开头包含了不同长度的soft-clipped碱基(即部分碱基不能比对到基因组,但保留在reads中)。PTMA 的扩增来自于FBI-Rim2的引物模板错位退火。剩余第三类reads占55.1%,在整个基因组中随机比对,而且大多数不包含任何与FBI-Rim2相关序列,这是基于Tn5应用的副产品,来自典型的全基因组低深度测序文库。

 

  FBI-seq流程及其特点:

  (A) FBI-seq的完整步骤:

  • 基因组DNA的片段化和Tn5转座酶的接头连接。
  • 在初级PCR中,通过FBI-SP引物的PTPA扩增目标基因(蓝框)的侧翼序列。分散在整个基因组中的数万个基因座(红框)也被FBI-SP和引物2的PTMA扩增。
  • 在次级PCR中,所有基于Illumina测序的序列元素都被添加。
  • 最终的文库结构为基于Illumina测序做准备。

  小编疑问:MGI平台未测试?

  (B)IGV展示了由单一FBI-seq文库产生的三种类型的reads/tags(即PTPA reads/tags、低覆盖率reads和PTMAreads/tags)。

  (C)堆积直方图展示了R498基因组中的FBI-SP PTMA位点序列。由7-、8-和9 nt的soft-clipped read1产生的PTMA标签,底部是Rim2引物序列。

  (D)直方图展示由不同长度的soft-clipped read1序列检测出来的PTMA标签数的分布。

  (E)热图展示了检测到的306K PTMA标签的分布。

  FBI-seq验证

  使用单一特异性引物检测这三种类型的reads对全基因组基因分型具有重要意义。首先,PTPA reads可用于跟踪目标基因的前景标记,而PTMA reads代表了超过数十万个背景标记,因此可以同时进行前景和背景基因分型。为了评估FBI-seq的用途、适用性和性能,作者评估了除FBI-Rim2以外的FBI-seq引物针对不同的前景基因或基因组区域是否也会发生PTPA和PTMA。

  通过设计以水稻Pi2基因作为靶点的特异性引物,确定了FBI-Pi2-1可以通过PTPA扩增Pi2基因。通过在Mu-seq方法中引入类似于FBI-seq的修饰,用非巢式引物取代巢式引物,扩增插入玉米突变系的分离(Ds)元件的侧翼序列,能够检测到大量PTMA。因此,说明了FBI-seq具有针对任何感兴趣的基因组位点设计引物的能力,可以同时扩增PTPA和PTMA reads。进一步对三个水稻品种(R498、ZF802和9311)进行FBI-seq,每个水稻品种使用FBI-Rim2引物进行3次技术重复,证明了由PTMA引发的扩增是稳定和可重复的。

  FBI-seq应用

  前景和背景的选择在回交转育中非常重要,作者从一个回交的BC2F4水稻群体(CNG1 × VE6219)中选择了5个株系,以测试FBI-seq方法同时进行前景和背景基因分型的性能。

  CNG1对稻瘟病易感,而VE6219携带6号染色体上的抗稻瘟病基因Pi2。对亲本的全基因组重测序发现CNG1和VE6219之间有190万个 SNPs。除了该FBI-Pi2-1引物外,还设计了另一种Pi2基因特异性引物(FBI-Pi2-2),其退火位点距离FBI-Pi2-1 有111 bp,并将其混合在一起进行FBI-seq文库制备,以测试两种FBI-seq引物是否会干扰多个前景位点的扩增和检测。因此,通过混合FBI-Pi2-1和FBI-Pi2-2对5个BC2F4系进行了FBI-seq。

  通过对从FBI-Pi2-1和FBI-Pi2-2开始的PTPA reads分析,证明FBI-seq可以同时用于多个基因的直接前景选择,确定了这5个水稻品系均携带来自供体亲本VE6219的Pi2等位基因。然后将检测的SNP分为低深度(with depth < 3×)、高深度(with depth ≥ 3× but missing rate > 20%)以及五个系共享SNP(with reads coverage depth ≥ 3× and missing rate ≤ 20%) )三类。构建binmap图谱,发现它们的背景基因分型结果高度一致,遗传背景回复率在83.8~93.0%。特别是在第6号染色体的Pi2区域附近,因为所有5个系都含有VE6219抗性等位基因。

 

 

  利用FBI-seq对水稻BC2F4群体的前景和背景基因分型

  (A)1Mb滑动窗口中SNP数量分布的Circos图:从外到内:(i) 双亲SNPs总数;(ii)五个BC2F4系共享SNPs数;(iii) 8GWB5-54系中的高深度(>3x)SNPs数;(iv) 8GWB5-54低深度(<3×)的SNPs数。

  ( B ) IGV展示了FBI-Pi2-1和FBI-Pi2-2引物在基因组上的结合位置以及PTPA reads对相邻区域的深度覆盖。

  ( C ) Pi2基因序列在Nipponbare、CNG1和VE6219之间的多序列比对。两个蓝色的水平箭头表示FBI-Pi2-1(1-19 bp)和FBI-Pi2-2(112 -131 bp)的引物结合区。四个垂直箭头表示该区域内三个水稻品种之间的SNPs。

  ( D ) CNG1 × VE6219群体中前景和背景选择的示意图。6号染色体上的黑线表示目标基因Pi2。五个BC2F4品系的样本名称:①8GWB5-54,②8GWB5-67,③8GWB5-83,④8GWB6-61,和⑤8GWB6-69。除了水稻,作者在番茄和豇豆上也应用了四种FBI-seq基因特异性引物,来说明了它在不同物种上的适用性。

  基因分型方法比较

  最后,作者也将FBI-seq与目前已知的常见基因分型方法进行了综合比较,突出了FBI-seq的优势。

 

  总体而言,FBI-seq是一种同时整合了前景与背景基因分型的新方法。在测序中,只需要使用一个特异性引物,其中前景基因分型采用PTPA ,背景基因分型采用PTMA。不同于基因芯片、多重PCR或基因组靶向测序,FBI-seq只需很少的引物设计等前期工作,且适用于不同的前景基因和物种。因此,很容易满足研究人员和育种人员的需求,在农作物品种鉴别、种质资源鉴定、遗传图谱构建、亲缘关系推测等领域有着重要的应用潜力。但实际效果如何,还需要时间来验证。

  数据分析Pipeline

  值得欣慰的是,作者公开了FBI-seq中PTMA tags检测的数据分析流程与脚本:https://github.com/dashengzhao/FBI-seq。

  流程从比对、排序及去重后的bam文件开始处理:

  1. 提取bam文件中read1的比对结果;
  2. 将sam文件拆分为两个文件;
  3. 计算其中一个sam文件中的碱基深度;
  4. 计算另一个sam文件中的碱基深度;
  5. 检测参考基因组的正负链中的PTMA tags;
  6. 合并正负链的PTMA tags;
  7. 获得基因组上所有与FBI-seq引物结合的标签区域。

  感兴趣的朋友可以测试下该流程,但关键还是在于前期引物设计和文库构建。


相关推荐

新品发布 | 百奥云推出基因组局部组装服务

百奥云基于二代/三代测序数据以及中间结果文件(如fq/bam),自研局部组装算法与流程,并结合了大数据产品基因云湖(GenoLake)的海量数据管理、查询与分析等功能,为用户提供个性化的局部组装服务。通过百奥云的局部组装方案,用户可以快速获取基因/蛋白全长序列信息,避免传统实验所带来的时间和资源浪费,加快决策周期,提高研究和生产效率。同时,还可有效地解决大规模测序数据存储、查询和分析等问题,提高数据利用率,获取更全面的基因组信息,助力动植物研究和育种生产的顺利进行。

04-07

2024

AI大数据 | 百奥云育种数据科学家顾林林发表一种高效精准的集成学习基因组选择方法ELPGV

是否存在一种方法可以整合各种模型的结果以期望获得更加精准的预测呢?

04-03

2024

喜讯 | 百奥云助力湖南农大解析水稻耐盐杂种优势之谜

近日,湖南农业大学刘次桃/段美娟团队在国际著名期刊《Journal of Integrative Plant Biology》上发表研究论文:The OsWRKY72–OsAAT30/OsGSTU26 module mediates reactive oxygen species scavenging to drive heterosis for salt tolerance in hybrid rice。百奥云大数据部门负责人彭建祥以共同作者身份为本研究提供了个性化的数据分析支持。

03-21

2024

水稻智能育种联盟 | 水稻种质资源、品种观摩暨育种创新提升工程恳谈会圆满举行

2024年3月21日上午,水稻智能育种联盟2024水稻种质资源、品种观摩暨育种创新提升工程恳谈会圆满举行,本次会议共有三十余名水稻种业同仁参会,分别来自十余家种企及科研单位,就如何充分利用数字化能力,将我国的种质资源优势进一步转化为育种创新优势的问题齐聚一起,共商水稻种质资源交流与合作共赢,探索水稻品种自主创新能力提升路径

03-21

2024

百奥云为南繁种业发展注入新动力,水稻基因体检服务首次参展

百奥云本次大会携水稻基因体检服务首次参展,诚邀各位专家、老师及同仁共同探讨探讨未来农业发展的新趋势和技术创新。

03-21

2024

会议邀请 | 百奥云与您相约2024中国种子(南繁硅谷)大会

百奥云参加此次大会并在B11展台进行展示,现场还有产品讲解及抽奖小礼品。欢迎广大业界同仁前来展台交流,共谋发展,我们在此真诚期待您的到来。

03-08

2024