PCR引物设计及软件使用技巧
互联网
PCR引物设计及软件使用技巧
张新宇,朱有康,高燕宁
(中国协和医科大学中国医学科学院肿瘤研究所,北京100021)
摘要:本文旨在介绍使用软件设计PCR引物的技巧。在PCR引物设计原则的基础上,详
细介绍了两种常用引物设计软件的基本使用方法,并对其各自的优缺点进行了比较。一般性
引物自动搜索可采用“PremierPrimer5”软件,而引物的评价分析则可采用“Oligo6”软件。
关键词:PCR;引物设计
中图分类号:Q524文献标识码:文章编号:
1
自从1985年KarnyMullis发明了聚合酶链式反应以来,PCR技术已成为分子生物学研
究中使用最多、最广泛的手段之一[1],而引物设计是PCR技术中至关重要的一环。使用不
合适的PCR引物容易导致实验失败:表现为扩增出目的带之外的多条带(如形成引物二聚
体带),不出带或出带很弱,等等。
现在PCR引物设计大都通过计算机软件进行。可以直接提交模板序列到特定网页,得
到设计好的引物,也可以在本地计算机上运行引物设计专业软件。一般来说,专门进行PCR
引物设计的专业软件功能更为强大,但使用起来却不太容易。本文将就引物设计原则及软件
使用问题进行探讨。
引物设计的原则
引物设计有3条基本原则:首先引物与模板的序列要紧密互补,其次引物与引物之间避
免形成稳定的二聚体或发夹结构,再次引物不能在模板的非目的位点引发DNA聚合反应(即
错配)。
具体实现这3条基本原则需要考虑到诸多因素,如引物长度(primerlength),产物长度
(productlength),序列Tm值(meltingtemperature),引物与模板形成双链的内部稳定性
(internalstability,用?G值反映),形成引物二聚体(primerdimer)及发夹结构(duplex
formationandhairpin)的能值,在错配位点(falseprimingsite)的引发效率,引物及产物的
GC含量(composition),等等。必要时还需对引物进行修饰,如增加限制性内切酶位点,
引进突变等。根据有关参考资料和笔者在实践中的总结,引物设计应注意如下要点:
1.引物的长度一般为15-30bp,常用的是18-27bp,但不应大于38,因为过长会导致其延
伸温度大于74℃,不适于TaqDNA聚合酶进行反应[2]。
2.引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导
致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增
加[2]。
3.引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配
位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应
当避免在引物的3’端使用碱基A[3][4]。另外,引物二聚体或发夹结构也可能导致PCR反
应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物[2]。
4.引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC
含量不能相差太大[2][5]。
5.引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有多种
方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(thenearest
neighbormethod)[6][7]。
6.?G值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定
性。应当选用3’端?G值较低(绝对值不超过9),而5’端和中间?G值相对较高的引
物。引物的3’端的?G值过高,容易在错配位点形成双链结构并引发DNA聚合反应[6]。
7.引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且
降低引物有效浓度而使PCR反应不能正常进行[8]。
8.对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载
体的相应序列而确定。
值得一提的是,各种模板的引物设计难度不一。有的模板本身条件比较困难,例如GC
2
含量偏高或偏低,导致找不到各种指标都十分合适的引物;在用作克隆目的的PCR因为产
物序列相对固定,引物设计的选择自由度较低。在这种情况只能退而求其次,尽量去满足条
件。
引物的自动搜索和评价分析
软件的引物设计功能主要体现在两个方面:首先是引物分析评价功能,该功能只有少数
商业版软件能够做到,其中以“Oligo6”最优秀;其次是引物的自动搜索功能,各种软件在
这方面的侧重点不同,因此自动搜索的结果也不尽相同。据笔者的经验,自动搜索功能以
“PremierPrimer”为最强且方便使用,“Oligo6”其次,其他软件如“VectorNTISuit”、
“Dnasis”、“Omiga”和“Dnastar”都带有引物自动搜索功能,但搜索结果不是十分理想。
要想得到效果很好的引物,在自动搜索的基础上还要辅以人工分析。笔者认为引物设计软件
的最佳搭配是“Oligo”和“Premier”软件合并使用,以“Premier”进行自动搜索,“Oligo”
进行分析评价,如此可快速设计出成功率很高的引物。
PrimerPremier5.0的使用技巧简介
1.功能
“Premier”的主要功能分四大块,其中有三种功能比较常用,即引物设计()、
限制性内切酶位点分析()和DNA基元(motif)查找()。“Premier”还具有同源
性分析功能(),但并非其特长,在此略过。此外,该软件还有一些特殊功能,其中
最重要的是设计简并引物,另外还有序列“朗读”、DNA与蛋白序列的互换()、
语音提示键盘输入()等等。
有时需要根据一段氨基酸序列反推到DNA来设计引物,由于大多数氨基酸(20种常见
结构氨基酸中的18种)的遗传密码不只一种,因此,由氨基酸序列反推DNA序列时,会
遇到部分碱基的不确定性。这样设计并合成的引物实际上是多个序列的混和物,它们的序列
组成大部分相同,但在某些位点有所变化,称之为简并引物。遗传密码规则因物种或细胞亚
结构的不同而异,比如在线粒体内的遗传密码与细胞核是不一样的。“Premier”可以针对模
板DNA的来源以相应的遗传密码规则转换DNA和氨基酸序列。软件共给出八种生物亚结
构的不同遗传密码规则供用户选择,有纤毛虫大核(CiliateMacronuclear)、无脊椎动物线粒
体(InvertebrateMitochondrion)、支原体(Mycoplasma)、植物线粒体(PlantMitochondrion)、
原生动物线粒体(ProtozoanMitochondrion)、一般标准(Standard)、脊椎动物线粒体(Vertebrate
Mitochondrion)和酵母线粒体(YeastMitochondrion)。
2.使用步骤及技巧
“Premier”软件启动界面如下:
3
其主要功能在主界面上一目了然(按钮功能如上述)。限制性酶切点分析及基元查找功
能比较简单,点击该功能按钮后,选择相应的限制性内切酶或基元(如-10序列,-35序列
等),按确定即可。常见的限制性内切酶和基元一般都可以找到。你还可以编辑或者添加新
限制性内切酶或基元。
进行引物设计时,点击按钮,界面如下:
进一步点击按钮,出现“searchcriteria”窗口,有多种参数可以调整。搜索目
的(SeachFor)有三种选项,PCR引物(PCRPrimers),测序引物(SequencingPrimers),
杂交探针(HybridizationProbes)。搜索类型(SearchType)可选择分别或同时查找上、下游引
物(Sense/Anti-sensePrimer,或Both),或者成对查找(Pairs),或者分别以适合上、下游
引物为主(CompatiblewithSense/Anti-sensePrimer)。另外还可改变选择区域(Search
Ranges),引物长度(PrimerLength),选择方式(SearchMode),参数选择(SearchParameters)
4
等等。使用者可根据自己的需要设定各项参数。如果没有特殊要求,建议使用默认设置。然
后按,随之出现的SearchProgress窗口中显示SearchCompleted时,再按,
这时搜索结果以表格的形式出现,有三种显示方式,上游引物(Sense),下游引物
(Anti-sense),成对显示(Pairs)。默认显示为成对方式,并按优劣次序(Rating)排列,满分
为100,即各指标基本都能达标(如下图)。
点击其中一对引物,如第1#引物,并把上述窗口挪开或退出,显示“PeimerPremier”
主窗口,如图所示:
该图分三部分,最上面是图示PCR模板及产物位置,中间是所选的上下游引物的一些
5
性质,最下面是四种重要指标的分析,包括发夹结构(Hairpin),二聚体(Dimer),错误引
发情况(FalsePriming),及上下游引物之间二聚体形成情况(CrossDimer)。当所分析的引
物有这四种结构的形成可能时,按钮由变成,点击该按钮,在左下角的
窗口中就会出现该结构的形成情况。一对理想的引物应当不存在任何一种上述结构,因此最
好的情况是最下面的分析栏没有,只有。值得注意的是中间一栏的末尾
给出该引物的最佳退火温度,可参考应用。
在需要对引物进行修饰编辑时,如在5’端加入酶切位点,可点击,然后修改
引物序列。若要回到搜索结果中,则点击按钮。
如果要设计简并引物,只需根据源氨基酸序列的物种来源选择前述的八种遗传密码规
则,反推至DNA序列即可。对简并引物的分析不需像一般引物那样严格。
总之,“Premier”有优秀的引物自动搜索功能,同时可进行部分指标的分析,而且容易
使用,是一个相当不错的软件。
Oligo6.22使用技巧简介
1.功能
在专门的引物设计软件中,“Oligo”是最著名的。它的使用并不十分复杂,但初学者容
易被其复杂的图表吓倒。Oligo5.0的初始界面是两个图:Tm图和ΔG图;Oligo6.22的界
面更复杂,出现三个图,加了个Frq图。“Oligo”的功能比“Premier”还要单一,就是引物
设计。但它的引物分析功能如此强大以至于能风靡全世界。
2.使用(以Oligo6.22为例)
Oligo6.22的启动界面如下:
图中显示的三个指标分别为Tm、ΔG和Frq,其中Frq是6.22版本的新功能,为邻近6
至7个碱基组成的亚单位在一个指定数据库文件中的出现频率。该频率高则可增加错误引发
6
的可能性。因为分析要涉及多个指标,起动窗口的cascade排列方式不太方便,可从windows
菜单改为tili方式。如果觉得太拥挤,可去掉一个指标,如Frq,这样界面的结构同于Oligo
5.0,只是显示更清楚了。
经过Windows/Tili项后的显示如图:
在设计时,可依据图上三种指标的信息选取序列,如果觉得合适,可点击Tm图块上左
下角的Upper按钮,选好上游引物,此时该按钮变成,表示上游引物已选
取好。下游引物的选取步骤基本同上,只是按钮变成Lower。?G值反映了序列与模板的结
合强度,最好引物的?G值在5’端和中间值比较高,而在3’端相对低(如图:)
Tm值曲线以选取72℃附近为佳,5’到3’的下降形状也有利于引物引发聚合反应。Frq曲线
为“Oligo6”新引进的一个指标,揭示了序列片段存在的重复机率大小。选取引物时,宜选
用3’端Frq值相对较低的片段。
当上下游引物全选好以后,需要对引物进行评价并根据评价对引物进行修改。首先检查
引物二聚体尤其是3’端二聚体形成的可能性。需要注意的是,引物二聚体有可能是上游或
下游引物自身形成,也有可能是在上下游引物之间形成(crossdimer)。二聚体形成的能值
越高,越不符合要求。一般的检测(非克隆)性PCR,对引物位置、产物大小要求较低,
因而应尽可能选取不形成二聚体或其能值较低的引物。第二项检查是发夹结构(hairpin);
与二聚体相同,发夹结构的能值越低越好。一般来说,这两项结构的能值以不超过4.5为好。
当然,在设计克隆目的的PCR引物时,引物两端一般都添加酶切位点,必然存在发夹结构,
而且能值不会太低。这种PCR需要通过灵活调控退火温度以达到最好效果,对引物的发夹
结构的检测就不应要求太高。第三项检查为GC含量,以45-55%为宜。有一些模板本身的
GC含量偏低或偏高,导致引物的GC含量不能被控制在上述范围内,这时应尽量使上下游
引物的GC含量以及Tm值保持接近,以有利于退火温度的选择。如果PCR的模板不是基
因组DNA,而是一个特定模板序列,那么最好还进行Falseprimingsite的检测。这项检查
可以看出引物在非目的位点引发PCR反应的可能性。如果引物在错配位点的引发效率比较
高,就可能出假阳性的PCR结果。一般在错配引发效率以不超过100为好,但对于特定的
7
8
模板序列,还应结合比较其在正确位点的引发效率。如果两者相差很大,比如在正确位点的
引发效率为450以上,而在错误位点的引发效率为130,那么这对引物也是可以接受的。
当我们结束以上四项检测,按Alt+P键弹出PCR窗口,其中总结性地显示该引物的位
置、产物大小、Tm值等参数,最有用的是还给出了推荐的最佳退火温度和简单的评价。
由于“Oligo”软件的引物自动搜索功能与“PrimerPremier5”的相类似,并且似乎并
不比后者更好用,在此不再赘述。其实,使用软件自动搜索引物就是让计算机按照人的要求
去寻找最佳引物,如果参数设置得当将大大提高工作效率。
除了本地引物设计软件之外,现在还有一些网上引物设计软件,如由WhiteheadInstitute
开发的“Primer3”等(本网站
http://210.72.11.60 已引进并调试好该软件,欢迎使用)。该
软件的独特之处在于,对全基因组PCR的引物设计;可以将设计好的引物对后台核酸数据
库进行比对,发现并排除可引发错配的引物。因此建议经常做全基因组PCR的用户试用。
参考文献(References):
[1]H.A.艾得希主编,田丁等译.PCR技术――DNA扩增的原理与应用.北京:北京医科大学中国协
和医科大学联合出版社,1991.
[2]林万明著.PCR技术操作与应用指南.北京:人民军医出版社,1993.
[3]朱平主编.PCR基因扩增实验操作手册.北京:中国科学技术出版社,1992
[4]郑仲承.寡核苷酸的优化设计,生命的化学,2001,21(3):254-256.
[5]GeorgeH.KellerMarkM.Manak.DNAprobes.1992.
[6]Oligo软件帮助文件(Oligo.HLP).
[7]Martin,F.H.,Castro,M.M.,andTinoco,Jr.I.Basepairinginvolvingdeoxyinisine,implicationsfor
probedesign.NucleicAcidsRes,1985,13:8927-8938.
[8]Rychlik,W.andRhoads,R.E.Acomputerprogramforchoosingoptimaloligonucleotidesforfilter
hybridization,sequencingandinvitroamplificationofDNA.NucleicAcidsRes,1989,17:
8543-8551.