育种专栏 | 6-基因分型新技术:FBI-seq

前沿分享

2022-10-28


小编本来计划这周介绍基因分型之靶向测序技术,不想近日了解到中国农科院深圳农业基因组研究所常玉晓老师最新研发的基因分型技术——FBI-seq:A prolific and robust whole-genome genotyping method using PCR amplification via primer-template mismatched annealing,因此先和大家一起来了解这项新鲜出炉的技术。

    FBI-seq发现

  FBI-seq(Foreground and Background Integrated genotyping by sequencing),不是美国联邦调查局测序,而是整合前景与背景的基因分型测序。顾名思义,该项技术实现了对前景基因和遗传背景同时进行了检测和选择。前景与背景的选择在分子育种中是两个非常重要的步骤,目前育种家们往往需要分开独立地进行这两步:即首先筛选前景目标位点,然后开发大量的探针/诱饵/PCR引物进行背景基因型的检测,这些耗时长与高投入成本的准备工作大大延迟了育种项目的启动。

  一般而言,我们设计PCR引物进行基因型检测时往往希望扩增产物是具有特异性的,即只在基因组的某个位置发生,这样才能精准地对目标位点进行检测。但是非特异性的扩增在PCR反应中是普遍存在的,人们通常利用优化引物设计、PCR反应体系等方法来减少或抑制非特异性扩增。这项研究反其道行之,研究了如何增强非特异性扩增。之前的观点认为,非特异性扩增是由引物在其同源或部分同源位点退火引起,一般数量较少。本研究意外发现,任意PCR引物,除了其引物与DNA模板间完美匹配(Primer-Template Perfect Annealing, PTPA)的位点外,在基因组上存在着数以万计的引物与DNA模板间不完美匹配(Primer-Template Mismatched Annealing, PTMA)的位点,而且PTMA的扩增是稳定、可重复的。基于这一意外发现,研究人员开发了FBI-seq。

  FBI-seq流程

  为了高效分离已知DNA片段侧翼的未知序列,常老师团队早前已经研发出侧翼序列标签测序方法(FST-seq)。FST-seq使用特定的巢式引物退火来获取目标序列以及由Tn5转座酶添加接头。起初研究人员是想利用不同转座子通过Tn5转座酶进行高效的接头连接,通过扩增大量的FSTs作为分子遗传标记,而非像常规研究那样每一个位点都需要设计对应的引物来扩增。

  在分析测序数据时,由于无意中使用了与Rim2转座子的引物,而不是原本的巢式引物,他们意外发现了三种类型的reads。每种类型的reads都不同,因为从read1开始的序列是唯一的,而且当多条reads比对到相同区域时,就形成了标签(tags)。第一类PTPA reads/tags占1.1%,从Rim2引物序列开始(FBI-Rim2),在离转座子约350bp处结束。第二类PTMA占43.8%,其模式与PTPA相似,但在read1的开头包含了不同长度的soft-clipped碱基(即部分碱基不能比对到基因组,但保留在reads中)。PTMA 的扩增来自于FBI-Rim2的引物模板错位退火。剩余第三类reads占55.1%,在整个基因组中随机比对,而且大多数不包含任何与FBI-Rim2相关序列,这是基于Tn5应用的副产品,来自典型的全基因组低深度测序文库。

 

  FBI-seq流程及其特点:

  (A) FBI-seq的完整步骤:

  • 基因组DNA的片段化和Tn5转座酶的接头连接。
  • 在初级PCR中,通过FBI-SP引物的PTPA扩增目标基因(蓝框)的侧翼序列。分散在整个基因组中的数万个基因座(红框)也被FBI-SP和引物2的PTMA扩增。
  • 在次级PCR中,所有基于Illumina测序的序列元素都被添加。
  • 最终的文库结构为基于Illumina测序做准备。

  小编疑问:MGI平台未测试?

  (B)IGV展示了由单一FBI-seq文库产生的三种类型的reads/tags(即PTPA reads/tags、低覆盖率reads和PTMAreads/tags)。

  (C)堆积直方图展示了R498基因组中的FBI-SP PTMA位点序列。由7-、8-和9 nt的soft-clipped read1产生的PTMA标签,底部是Rim2引物序列。

  (D)直方图展示由不同长度的soft-clipped read1序列检测出来的PTMA标签数的分布。

  (E)热图展示了检测到的306K PTMA标签的分布。

  FBI-seq验证

  使用单一特异性引物检测这三种类型的reads对全基因组基因分型具有重要意义。首先,PTPA reads可用于跟踪目标基因的前景标记,而PTMA reads代表了超过数十万个背景标记,因此可以同时进行前景和背景基因分型。为了评估FBI-seq的用途、适用性和性能,作者评估了除FBI-Rim2以外的FBI-seq引物针对不同的前景基因或基因组区域是否也会发生PTPA和PTMA。

  通过设计以水稻Pi2基因作为靶点的特异性引物,确定了FBI-Pi2-1可以通过PTPA扩增Pi2基因。通过在Mu-seq方法中引入类似于FBI-seq的修饰,用非巢式引物取代巢式引物,扩增插入玉米突变系的分离(Ds)元件的侧翼序列,能够检测到大量PTMA。因此,说明了FBI-seq具有针对任何感兴趣的基因组位点设计引物的能力,可以同时扩增PTPA和PTMA reads。进一步对三个水稻品种(R498、ZF802和9311)进行FBI-seq,每个水稻品种使用FBI-Rim2引物进行3次技术重复,证明了由PTMA引发的扩增是稳定和可重复的。

  FBI-seq应用

  前景和背景的选择在回交转育中非常重要,作者从一个回交的BC2F4水稻群体(CNG1 × VE6219)中选择了5个株系,以测试FBI-seq方法同时进行前景和背景基因分型的性能。

  CNG1对稻瘟病易感,而VE6219携带6号染色体上的抗稻瘟病基因Pi2。对亲本的全基因组重测序发现CNG1和VE6219之间有190万个 SNPs。除了该FBI-Pi2-1引物外,还设计了另一种Pi2基因特异性引物(FBI-Pi2-2),其退火位点距离FBI-Pi2-1 有111 bp,并将其混合在一起进行FBI-seq文库制备,以测试两种FBI-seq引物是否会干扰多个前景位点的扩增和检测。因此,通过混合FBI-Pi2-1和FBI-Pi2-2对5个BC2F4系进行了FBI-seq。

  通过对从FBI-Pi2-1和FBI-Pi2-2开始的PTPA reads分析,证明FBI-seq可以同时用于多个基因的直接前景选择,确定了这5个水稻品系均携带来自供体亲本VE6219的Pi2等位基因。然后将检测的SNP分为低深度(with depth < 3×)、高深度(with depth ≥ 3× but missing rate > 20%)以及五个系共享SNP(with reads coverage depth ≥ 3× and missing rate ≤ 20%) )三类。构建binmap图谱,发现它们的背景基因分型结果高度一致,遗传背景回复率在83.8~93.0%。特别是在第6号染色体的Pi2区域附近,因为所有5个系都含有VE6219抗性等位基因。

 

 

  利用FBI-seq对水稻BC2F4群体的前景和背景基因分型

  (A)1Mb滑动窗口中SNP数量分布的Circos图:从外到内:(i) 双亲SNPs总数;(ii)五个BC2F4系共享SNPs数;(iii) 8GWB5-54系中的高深度(>3x)SNPs数;(iv) 8GWB5-54低深度(<3×)的SNPs数。

  ( B ) IGV展示了FBI-Pi2-1和FBI-Pi2-2引物在基因组上的结合位置以及PTPA reads对相邻区域的深度覆盖。

  ( C ) Pi2基因序列在Nipponbare、CNG1和VE6219之间的多序列比对。两个蓝色的水平箭头表示FBI-Pi2-1(1-19 bp)和FBI-Pi2-2(112 -131 bp)的引物结合区。四个垂直箭头表示该区域内三个水稻品种之间的SNPs。

  ( D ) CNG1 × VE6219群体中前景和背景选择的示意图。6号染色体上的黑线表示目标基因Pi2。五个BC2F4品系的样本名称:①8GWB5-54,②8GWB5-67,③8GWB5-83,④8GWB6-61,和⑤8GWB6-69。除了水稻,作者在番茄和豇豆上也应用了四种FBI-seq基因特异性引物,来说明了它在不同物种上的适用性。

  基因分型方法比较

  最后,作者也将FBI-seq与目前已知的常见基因分型方法进行了综合比较,突出了FBI-seq的优势。

 

  总体而言,FBI-seq是一种同时整合了前景与背景基因分型的新方法。在测序中,只需要使用一个特异性引物,其中前景基因分型采用PTPA ,背景基因分型采用PTMA。不同于基因芯片、多重PCR或基因组靶向测序,FBI-seq只需很少的引物设计等前期工作,且适用于不同的前景基因和物种。因此,很容易满足研究人员和育种人员的需求,在农作物品种鉴别、种质资源鉴定、遗传图谱构建、亲缘关系推测等领域有着重要的应用潜力。但实际效果如何,还需要时间来验证。

  数据分析Pipeline

  值得欣慰的是,作者公开了FBI-seq中PTMA tags检测的数据分析流程与脚本:https://github.com/dashengzhao/FBI-seq。

  流程从比对、排序及去重后的bam文件开始处理:

  1. 提取bam文件中read1的比对结果;
  2. 将sam文件拆分为两个文件;
  3. 计算其中一个sam文件中的碱基深度;
  4. 计算另一个sam文件中的碱基深度;
  5. 检测参考基因组的正负链中的PTMA tags;
  6. 合并正负链的PTMA tags;
  7. 获得基因组上所有与FBI-seq引物结合的标签区域。

  感兴趣的朋友可以测试下该流程,但关键还是在于前期引物设计和文库构建。


相关推荐

百奥繁育 | 良种选育的信息管理系统

百奥繁育 | 良种选育的信息管理系统

09-06

2023

江西种业也刮智能育种风

8月25日,江西省水稻种质资源创新交流及智能育种技术研讨会在江西省农科院顺利召开。江西农业大学、江西师范大学、广东省农科院、江西省农科院、中国水稻所江西早稻中心、南昌市农科院、赣州市农科所有关专家代表以及省内种企代表共约40人参与了本次交流会议。

08-28

2023

百奥云 & 火山引擎 | 为现代农业的“芯片”增添新科技

育种4.0时代,比拼的是科技创新,关键是通过数字化、信息化、智能化让育种过程缩短周期、提升效率、降低风险,而这也是长沙百奥云数据科技有限公司(百奥云)的创业初衷。

08-22

2023

百奥繁育 | 育种田间的信息流水线

有人说,植物育种的过程就像工厂流水线。挑选的种质即原材料,根据市场需求进行设计与加工,送入田间生产线后,一代代优中选优,还得经过严格的产量、品质、抗性测试,过五关斩六将,最终拿到审定编号,成为可以推广的成熟产品。 虽然流程相似,但育种工作远不及工厂生产那样标准。田间环境气候复杂、真实性状判断困难、水肥条件难以统一……种种困难下,选育良种成了概率事件,育种家们都有种“尽人事听天命”的无奈感。

08-22

2023

百奥云新品发布 | 高质量基因组极速拼接服务

1. 利用PopGenomics快速对基因组实现高质量组装 基因组组装是将全基因组测序的小片段(reads长度100 bp-100 kb)通过算法拼接成尽量长的片段(contig 和scaffold,长度几十kb 到Mb 不等)或者整条染色体的过程。获得包含基因组全序列的参考基因组是对动植物进行基因组学研究和育种利用的前提[1]。 由于植物基因组具有非常丰富的多样性,参考已发表的少数物种组装新的物种,有时却无法达到理想的组装效果。测序技术发展提供了短序列测序、单分子测序、光学图谱、Hi-C 图谱等多种测序技术及其组合的组装方案,到目前为止,已经有上千个植物基因组被组装(图1)。然而,如何以最低成本快速获得满足需求的高质量基因组,仍然是科研人员和育种数据分析人员普遍面临的一个问题。

08-22

2023

夏风又绿田间草,除草劳动正当时

7月26日,顶着炎炎夏日 在公司CSO桂進老师的带领下 举行了一场别开生面的劳动体验。

08-04

2023