育种专栏 | 4-基因分型之固相芯片

前沿分享

2022-10-07


前面介绍到基因/SNP分型是现代分子育种的关键

SNP检测又有很多技术和方法

如基因芯片、简化基因组测序、重测序、靶向测序等

一种好的SNP分型方法应该兼顾了通量、成本、稳定性和灵活性等因素

因此小编计划介绍几种目前常见的SNP分型方法

本篇就先从 基因芯片 开始吧。

  基因芯片简介

  首次听到“基因芯片”的外行人很容易将其与工业上集成电路的电子芯片联系起来,实际上它们除了都利用缩微技术使得外观比较像以外,其他没什么关系,纯属碰瓷。基因芯片又称为DNA 芯片、生物芯片或DNA微阵列等,是根据分子间的特异性相互作用的原理,将不连续的分析过程集成于硅或玻璃等固相芯片表面,以实现对细胞、蛋白质、基因及其他生物成分的准确、快速、大量的检测。根据特定的科研应用内容,基因芯片可以细分为微阵列比较基因组杂交( a-CGH) 芯片、microRNA 芯片、SNP芯片、表达谱芯片、DNA甲基化芯片和染色质免疫共沉淀芯片等。

  第一张商业化基因芯片在1996 年诞生。随着生物技术的发展,到目前为止,在生物分子检测和基因型鉴定领域,包含高密度分子标记或探针的生物芯片发挥着巨大作用,已广泛应用于医学检测与诊断、基因组学、遗传学和动植物育种。尤其是医学研究领域已经产生了大量的芯片数据,NCBI的GEO是目前最大的芯片数据库,也成了众多科研人员公共数据挖掘的重要来源。与传统的检测方法相比,基因芯片可以一次性固定数万个探针,从而检测数万个已知序列的相应信息。

  SNP芯片技术就是将第3代SNP标记固定在载体上形成密集的寡核苷酸探针阵列,再与目标DNA 进行等位基因特异性反应,根据反应后信号的有无和强弱确定SNP位点的多态性,该技术可以对作物全基因组实现快速、高密度的扫描,特别是对育种工作中的大量群体样本进行基因型鉴定时,单个检测位点成本很低,是一种高集成、高通量、微型化和自动化的检测SNP的手段。SNP芯片依据自身高通量、自动化和高灵敏度等特点,被学术界和商业科研机构普遍认为具有重大的研究价值,也有很好的产业化趋势。知名商业化公司如ThermoFisher、Agilent、Illumina、Affymetrix(已被ThermoFisher收购,为了更好区分,此处仍以Affymetrix为名)等,其中Illumina的Infinium技术和Affymetrix的Axiom技术应该是目前较为流行的高密度SNP芯片解决方案,所以这里重点介绍一下这两项技术。

  Illumina Infinium BeadChip

  Illumina的生物芯片系统主要由芯片、扫描仪和分析软件组成。而芯片则由玻璃基片和微珠两部分组成。

  Illumina Infinium芯片是基于微珠的 BeadArray生物芯片,首先在玻璃基片(称为Wafer)上,通过光蚀刻的方法蚀刻出许多个排列整齐的小孔,每个小孔直径约为3 μm,这些小孔刚好可以容纳一个微珠。微珠是芯片的核心部分,每个微珠的表面偶联了几十万条相同序列的DNA 片段。这些DNA片段的长度是73个碱基,分成2个功能区域,靠近珠子一侧的23 个碱基的序列被称为Address 序列,是标识微珠的标签序列,相当于微珠的身份证号码(ID 号);远离珠子端的50 个碱基被称为探针序列,是针对某一个特定的SNP 位点设计的,作用是与目标DNA 进行互补杂交。Address 序列与探针序列之间是一一对应的关系。

  在Illumina 芯片生产过程中,把几十万种微珠按设定的比例混合好,撒到玻璃基片上,微珠随机落入基片的小孔中,通过检测微珠上DNA 片段单碱基延伸时所掺入的dNTP 上所带的荧光信号来区别不同的基因型。

 

  图片说明:

  A:在玻璃基片上光蚀刻出直径约为3 μm 的整齐小孔,每个小孔刚好可以容纳一个微珠;

  B:微珠表面偶联了几十万条相同序列的DNA 片段,靠近珠子一侧的23nt 序列是用于标识微珠的Address 序列,而远离珠子端的50nt 序列是待测SNP 位点特异性的探针序列;

  C:用绿色荧光标记C 碱基,用红色荧光标记T 碱基,以基因型为CT 的SNP 为例,如果发出的光为绿色,则是CC 纯合子,如果发出的光为红色,则为TT 纯合子,如果绿色和红色荧光都有,而且光强度差不多,那么该位点则是CT 杂合子。

  Illumina的SNP芯片具有如下优势:

  检测通量大,一次可以检测几十万到几百万个SNP位点;

  检测准确性高,可以达到99.9%以上;

  检测的费用相对低廉,大约一个90万位点的芯片(每个样本的)检测费用在一两千元。在农作物育种方面,Illumina Infinium BeadChip技术已经设计研发出大量SNP芯片,如水稻6K、玉米50K和3K、小麦9K和90K、大麦的9K等。

  Affymetrix AxiomAffymetrix 公司主要有GeneAtlas、7G、DX2和GeneTitan四种机型,应用最广的两种生物芯片是表达谱芯片和SNP分型芯片。SNP芯片制作也是通过“光蚀刻”完成的,即在一张大的玻璃基片上合成DNA 探针,探针的3′端固定到玻璃基片上,相同序列的探针都是针对同一个SNP 设计的。

  Affymetrix Axiom 分型芯片是基于连接反应进行基因型检测:首先设计4 套显色探针,A、C、G、T 各一组,这些探针长度都是9 个碱基,其中只有3′末端的第1 个碱基是特异的,从第2 个碱基到第9 个碱基都是简并的;3′端是C或G碱基的探针的5′端带有一个生物素标签,最后会被染成红色荧光;3′端是A 或T 碱基的探针的5′端带另外一种标签,最后会被染成绿色荧光。

  以一个基因型为GT 的SNP 位点为例,先设计这个SNP 位点的特异性探针(通过羟基连接在芯片上,也称为“捕获探针”),该探针正好延长到SNP 位点旁边的一个碱基处;当样本DNA 经过变性后,单链DNA 会与捕获探针退火杂交;再加入4 种显色探针,通过连接酶进行连接,因为连接酶对连接位点前后几个碱基进行精确识别,所以只有与目标DNA 片段完全互补的显色探针才会被连接酶连接到捕获探针上去;连接反应完成后,将游离的显色探针洗掉,再用带荧光标记的染色试剂进行染色;最后,在激光扫描仪中对芯片进行扫描,扫描过程中,如果看到该探针上所发出的光是单纯红色,就可以判断这个位点的SNP 型是GG 型纯合子;如果发出的荧光是单纯的绿光,那么就可以判断这个SNP 是TT 型纯合子;如果发出的光,既有红光又有绿光,而且红光和绿光的光强差不多,则可以判断这个SNP 位点是GT 的杂合子。

  图片说明:

  A:在一张大的玻璃基片上直接合成DNA 探针,探针的3′端固定在玻璃基片上;

  B:设计A、T、C、G 4 种碱基的显色探针,探针的3′末端的第1 个碱基是特异的,从第2~9 个碱基都是简并的,其中 C 或G 最后会被染成红色荧光,而A 或T 会被染成绿色荧光;

  C:以一个基因型为GT 的杂合子为例,芯片上的探针正好延长到SNP 位点前的一个碱基处,只有与目标DNA 片段完全互补,C 或A 碱基的显色探针才会被连接酶连接到捕获探针上。

  Affymetrix Axiom也在农作物育种领域设计研发了很多代表性芯片,如小麦660K、水稻50K、玉米50K和600K、大豆180K等。除了Illumina和Affymetrix外,Agilent的生物芯片也是很常用的。生物芯片系统比较类似,即由扫描仪、生物芯片、分析软件三部分组成,感兴趣的可去官网了解。尽管商业化的SNP芯片已经广泛应用于育种,但仍有以下不足:

  标记数量有限,难满足所有类型研究需求,如QTL精细定位;

  只能检测已知突变,无法检测新生突变;

  一般针对某些知名品种设计,与大多数研究的地方品种或闭锁群体的遗传距离较大,造成部分标记位点在特定群体中失效(如早期基于B73 和Mo17 这2个温带玉米自交系测序草图开发的SNP 芯片,无法识别出热带玉米基因组中的优异等位变异)。需要对特定品种特定群体进行芯片定制,提高了成本。SNP芯片简单介绍到这里,下节我们将继续了解全基因组水平的SNP分型策略——基因组重测序,包括简化基因组测序,它们在一定程度上弥补了高密度SNP芯片的不足。敬请期待。


相关推荐

百奥繁育 | 良种选育的信息管理系统

百奥繁育 | 良种选育的信息管理系统

09-06

2023

江西种业也刮智能育种风

8月25日,江西省水稻种质资源创新交流及智能育种技术研讨会在江西省农科院顺利召开。江西农业大学、江西师范大学、广东省农科院、江西省农科院、中国水稻所江西早稻中心、南昌市农科院、赣州市农科所有关专家代表以及省内种企代表共约40人参与了本次交流会议。

08-28

2023

百奥云 & 火山引擎 | 为现代农业的“芯片”增添新科技

育种4.0时代,比拼的是科技创新,关键是通过数字化、信息化、智能化让育种过程缩短周期、提升效率、降低风险,而这也是长沙百奥云数据科技有限公司(百奥云)的创业初衷。

08-22

2023

百奥繁育 | 育种田间的信息流水线

有人说,植物育种的过程就像工厂流水线。挑选的种质即原材料,根据市场需求进行设计与加工,送入田间生产线后,一代代优中选优,还得经过严格的产量、品质、抗性测试,过五关斩六将,最终拿到审定编号,成为可以推广的成熟产品。 虽然流程相似,但育种工作远不及工厂生产那样标准。田间环境气候复杂、真实性状判断困难、水肥条件难以统一……种种困难下,选育良种成了概率事件,育种家们都有种“尽人事听天命”的无奈感。

08-22

2023

百奥云新品发布 | 高质量基因组极速拼接服务

1. 利用PopGenomics快速对基因组实现高质量组装 基因组组装是将全基因组测序的小片段(reads长度100 bp-100 kb)通过算法拼接成尽量长的片段(contig 和scaffold,长度几十kb 到Mb 不等)或者整条染色体的过程。获得包含基因组全序列的参考基因组是对动植物进行基因组学研究和育种利用的前提[1]。 由于植物基因组具有非常丰富的多样性,参考已发表的少数物种组装新的物种,有时却无法达到理想的组装效果。测序技术发展提供了短序列测序、单分子测序、光学图谱、Hi-C 图谱等多种测序技术及其组合的组装方案,到目前为止,已经有上千个植物基因组被组装(图1)。然而,如何以最低成本快速获得满足需求的高质量基因组,仍然是科研人员和育种数据分析人员普遍面临的一个问题。

08-22

2023

夏风又绿田间草,除草劳动正当时

7月26日,顶着炎炎夏日 在公司CSO桂進老师的带领下 举行了一场别开生面的劳动体验。

08-04

2023