Pyrosequencing技术及其在DNA测序和SNP研究中的应用
互联网
DNA 序列分析技术是现代生命科学研究的核心技术之一,而双脱氧核苷酸链终止法(Sanger法)是目前使用最普遍的DNA 序列分析技术。在基于Sanger法的全自动DNA 测序技术中,测序反应产生的DNA 片段是荧光标记的,这些片段经过平板胶电泳或毛细管电泳得到分离,荧光分子被激发而发光,发出的光信号被检测系统检测。Sanger法的优势在于可以分析未知DNA 的序列,且单向反应的读序能力较长,目前的技术可以达到1000bp以上。
在实际工作中,很多情况需要对已知序列的DNA 片段进行序列验证,而这种分析往往测几十bp就可以满足需要.在这种情况下,Sanger法未必是最合适的DNA序列分析技术。新发展的Pyrosequencing(焦磷酸测序)技术应该是目前最适合这些应用的DNA序列分析技术。
Pyrosequencing技术是新一代DNA 序列分析技术,该技术对DNA 的序列分析无须进行电泳,DNA 片段无须荧光标记,因此相应的仪器系统无须荧光分子的激发和检测装置.本文将就Pyrosequencing技术的原理和应用进行介绍和讨论.
一、Pyrosequencing技术的原理
首先通过PCR制备待测序的DNA模板,PCR的引物之一是用生物素标记的。PCR产物和偶连avidin的Sepharose微珠孵育,DNA双链经碱变性分开;纯化得到含生物素标记引物的待测序单链,并和测序引物结合成杂交体。
Pyrosequencing技术是由四种酶催化的同一反应体系中的酶级连反应,四种酶是:DNA聚合酶(DNA polymerase)、硫酸化酶(ATP sulfurylase)、荧光素酶(luciferase)和双磷酸酶(apyrase).反应底物为adenosine 5´ phosphosulfate (APS)、荧光素(luciferin)。反应体系还包括待测序DNA单链和测序引物。反应体系配置好后就可以加入底物dNTP进行序列分析了。
测序反应是这样进行的:
在每一轮测序反应中,只能加入四种dNTP(dATP S,dTTP,dCTP,dGTP)之一,如该dNTP与模扳配对,聚合酶就可以催化该dNTP掺入到引物链中并释放焦磷酸基团(PPi)。
掺入的dNTP和释放的焦磷酸是等摩尔数目的.注意:反应时deoxyadenosine alfa-thio triphosphate (dATP S)是dATP的替代物,因为DNA聚合酶对dATP S的催化效率比对dATP的催化效率高,且dATP S不是荧光素酶的底物。
硫酸化酶催化APS和PPi形成ATP,ATP和焦磷酸的摩尔数目是一致的。ATP驱动荧光素酶介导的荧光素向氧化荧光素(oxyluciferin)的转化,氧化荧光素发出与ATP量成正比的可见光信号。光信号由CCD摄像机检测并由pyrogram™反应为峰。每个峰的高度(光信号)与反应中掺入的核苷酸数目成正比。ATP和未掺入的dNTP由双磷酸酶降解,淬灭光信号,并再生反应体系。然后就可以加入下一种dNTP。 Pyrosequencing技术的原理: 随着以上过程的循环进行,互补DNA链合成,DNA序列由Pyrogram的信号峰确定。
商品化的Pyrosequncing试剂盒通过以下几点来保证反应的有效进行:底物浓度已最佳化,高质量的三磷酸腺苷双磷酸酶保证了所有的dNTP被降解,包括ATP和dATPαS;dNTP降解速率慢于掺入速率,有利于dNTP充分掺入;ATP合成速率快于ATP水解速率,使的ATP浓度和光产生正比于掺入的dNTP数目。
有必要指出的是:Pyrosequencing技术可以确定一个模板的20-30bp的序列。有的研究者经过改进而使该技术的读序长度增加一倍以上。
为了增加信噪比,在Pyrosequencing技术中,用dATPαS取代dATP,因为dATPαS可以比dATP被DNA聚合酶更有效利用,也更有利于阅读富含T的区域,且dATPαS不是荧光素酶的底物。但dATPαS是两种异构体SpdATPαS和RpdATPαS的混合物,聚合酶只能利用SpdATPαS。
因此,为了得到最佳反应效率,必需使反应体系中保持最佳浓度的SpdATPαS,但同时增加了相应浓度的无用的RpdATPαS。dATPαS被双磷酸酶降解后的产物是双磷酸酶的抑制剂,所以随着反应进行,被双磷酸酶降解的dATPαS的降解产物浓度越来越大,双磷酸酶的活性越来越低。这可能是Pyrosequencing技术测序长度很短(20-30bp)的主要原因之一。新的革新就在于在反应体系中只加入SpdATPαS,这样一来可以大大降低dATPαS降解产物的浓度,维持双磷酸酶较长时间的活性。目前这个革新可以使Pyrosequencing技术的测序长度增加最少一倍,达到50至上百bp。
二、Pyrosequencing技术在DNA测序和SNP研究中的应用
Pyrosequencing是新一代DNA序列分析技术,因此该技术的第一个应用是DNA序列分析,基于该技术的分析系统配合相应软件还可以进行基于DNA序列分析的已知SNP的分析和SNP频率确定。
Pyrosequencing技术对DNA片段的序列分析的读序长度有限,但这并不影响其在生命科学研究中的价值.我们知道,在很多场合中,我们对DNA序列分析的要求是读序越长越好,比如诸如人类基因组计划的工作,而在很多场合中,读序长度并不是主要指标,读序精确和能说明问题是主要指标,比如分子临床诊断领域,对细菌和其他病原微生物的分子诊断,只需对最能代表该微生物的DNA片段进行分析即可,最能代表该微生物的DNA片段往往也就十几到几十bp。可以提供序列资料的分子诊断是分子诊断的黄金标准,其权威性比其他DNA分析方法如NORTHERN,基因芯片和定量RT-PCR技术更好。
SNP研究大致分为两个部分,一是SNP数据库的建立,二是SNP功能的研究。一种生物的所有SNP的数据库的建立是一件很大的工程,可以承担该工作的是那些具有大规模基因组测序能力的研究单位,而且数据库的建立很大程度上依赖Sanger法测序。但众所周知,如果不研究每个SNP的功能,数据库的建立即SNP的发现就没有多大意义。对已发现的SNP的功能的研究,有两个工作是必须的,一是SNP频率分析,一是SNP位点的碱基种类的证实.对于前者,Pyrosequencing是这样进行的:假设研究者手中有若干份来自不同个体的基因组DNA样品,要测这些不同样品的同一SNP的频率,那么研究者可以混合这些样本的基因组DNA,然后做一次PCR,进行一次测序,研究者就可以得到该SNP在这些样本中的频率.如果研究者已经有了各个样本的PCR产物,也可以将PCR产物混合后进行一次PYRO,就可以知道该SNP频率.已有的文献已经做过高达1126样本的PCR产物的混合来确定SNP的频率[2]。这种做法极大地减少了研究者的实验次数和实验消耗。一些其他研究也利用Pyrosequencing技术来确定SNP频率[3,4]。如果是SNP位点的碱基种类的证实,需要首先得到特定SNP所在DNA片段,即PCR产物,然后在SNP位点的上游和/或下游设计测序引物,这样通过对十几个bp序列测定来确定SNP位点的碱基种类及SNP位点上下游十几个碱基的序列.诸如四倍体马铃薯的一些SNP分析[5]和用于法医研究的线粒体DNA SNP分析[6]也是利用Pyrosequencing技术进行的。