【原创】引物设计方法
丁香园论坛
3102
最近在做一批细胞,打算要做PCR,因此引物设计这关逃不过了。beta 2 (TGFB2)、TGF A、VEGFC、VEGI
各位同仁,我通过向两个老师请教设计了两套引物,方法如下。待各位同仁哪一种方法比较好。
引物是人工合成的两段寡核苷酸序列,一个引物与感兴趣区域一端的一条DNA模板链互补,另一个引物与感兴趣区域另一端的另一条DNA模板链互补。
设计原则:
引物与模板的序列要紧密互补。
引物与引物之间避免形成稳定的二聚体或发夹结构。
引物不能在模板的非目的位点引发DNA 聚合反应(即错配)。
(1)引物长度
引物的长度控制着产物的特异性和在PCR反应中的退火温度。
引物的长度一般为15-30bp,最好在18-24bp,但不能超过38bp。
引物每增加一个核苷酸, 引物特异性提高4 倍。太短易形成错配(False Priming), 降低特异性; 长PCR引物能给扩增带来更好的特异性,长引物也允许通过降低退火温度来能提高反应的灵敏度,不过长引物通常更易于形成包括发卡结构、二聚体自身互补等二级结构。
(2)碱基分布的均衡性
引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的G或C,因这样会使引物在G+C富集序列区错误引发。
GC含量一般40-60%
—GC含量太低导致引物Tm值较低,使用较低的退火温度不利于提高PCR的特异性。
—GC含量太高也易于引发非特异扩增。
(3)引物Tm值:DNA熔解温度,指把DNA的双螺旋结构降解一半时的温度。
一般要求:55℃-65℃。
计算:—对于低于20个碱基的引物,Tm值可根据Tm=4(G+C)+2(A+T)来粗略估算
—对于较长引物,Tm值则需要考虑热动力学参数,从“最近邻位”的计算方式得到,这也是现有的引物设计软件最常用的计算方式。Tm = △H/(△S + R * ln (C/4)) + 16.6 log ([K+]/(1 + 0.7 [K+])) - 273.15
(4)引物的二级结构
引物二聚体(Dimer and Cross Dimer) —尽可能避免两个引物分子之间3’端有有较多碱基互补。
发夹结构 (Hairpin)—尤其是要避免引物3’端形成发夹结构,否则将严重影响DNA聚合酶的延伸。
Hairpin 发卡结构
发卡结构的形成是由于引物自身的互补碱基分子内配对造成,引物折叠形成的二级结构,并由于发卡结构的形成是分子内的反应,仅仅需要三个连续碱基配对。发卡结构的稳定性可以用自由能衡量,自由能大小取决于碱基配对释放的量以及折叠DNA形成发卡环所需要的能量,如果自由能值大于0则该结构不稳定,从而不会干扰反应。如果自由能值小于0 则该结构可以干扰反应。
Dimer 二聚体
引物之间的配对区域能形成引物二聚体,它是相同或不同的两条引物之间形成的二级结构。它造成引物二聚体扩增并减少目的扩增,产物二聚体可以在序列相同的两条引物或正反向引物之间形成,如果配对区域在3 末端问题会更为严重,3 末端配对很容易引起引物二聚体扩增。
(5)引物在模板内应具有单一性,也就是说在模板内部没有错配。如果引物可以结合除目的位点外的其他区域,扩增效率将明显降低,目的产物带将减少。提示:引物设计好后,最好做blast检测,检查同一物种基因组中是否存在高度同源序列。
(6) 设计RT-PCR引物时,引物所在的模板区域应该位于CDS区。因此,设定引物前应对模板序列进行序列分析。
重点的分歧在于引物设计
方法1:序列收索最常用的方法是从NCBI上搜索,选择CDs区,在Primer premier 5.0软件中输入核算序列,SEARCH,
在在结果窗口中给出了程序给该对引物的打分(rating)和上下游引物的起始位置和长度以及产物的长度。通过直接点击各对引物在相应引物搜寻界面中相应的显示引物的各种信息。包括其各种参数和各种可能存在的不利结构。一般预选择分值最高的3-4对引物,再根据引物设计的基本原则进一步筛选。主要观察其序列组成,错配、发夹环或二聚体的位置。将预选择得到的一系列引物分别在GeneBank 中进行回检, 也就是在NCBI 的nucleotide blast 中进行同源性检索。通过blast 弃掉与基因组其他部分同源性比较高的引物, 也就是有可能形成错配的引物。
方法2:从NCBI上搜索,记录CDs区,以及该区域内的exon,选择序列跨越两个exon,长度为18-24bp,为上游,另外选择跨越两个exon,长度为18-24bp,为下游,上下游的长度200-400bp,用Primer premier 5.0软件来查,所选择的序列的Tm值,GC含量,大概要一致。值得注意的是,老师说,对于二聚体以及发夹结构等可以不必过于在意,这是我的有疑问的地方,后面的BLAST一样。还有比如VEGI,从NCBI上搜索得到的基因序列只有部分,没有写出exon。
最后:beta 2 (TGFB2)、TGF A、VEGFC、VEGI,对于以上基因的引物,有哪位同仁之前有设计过的,麻烦发我看看。。。
以上问题,是我不太明白的地方,希望各种师兄师姐给予宝贵的意见。谢谢。
QQ 345202934(完美主义着)
邮箱:nacle1990829@163.com,这是联系方式,希望大家帮忙,再次感谢。
各位同仁,我通过向两个老师请教设计了两套引物,方法如下。待各位同仁哪一种方法比较好。
引物是人工合成的两段寡核苷酸序列,一个引物与感兴趣区域一端的一条DNA模板链互补,另一个引物与感兴趣区域另一端的另一条DNA模板链互补。
设计原则:
引物与模板的序列要紧密互补。
引物与引物之间避免形成稳定的二聚体或发夹结构。
引物不能在模板的非目的位点引发DNA 聚合反应(即错配)。
(1)引物长度
引物的长度控制着产物的特异性和在PCR反应中的退火温度。
引物的长度一般为15-30bp,最好在18-24bp,但不能超过38bp。
引物每增加一个核苷酸, 引物特异性提高4 倍。太短易形成错配(False Priming), 降低特异性; 长PCR引物能给扩增带来更好的特异性,长引物也允许通过降低退火温度来能提高反应的灵敏度,不过长引物通常更易于形成包括发卡结构、二聚体自身互补等二级结构。
(2)碱基分布的均衡性
引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的G或C,因这样会使引物在G+C富集序列区错误引发。
GC含量一般40-60%
—GC含量太低导致引物Tm值较低,使用较低的退火温度不利于提高PCR的特异性。
—GC含量太高也易于引发非特异扩增。
(3)引物Tm值:DNA熔解温度,指把DNA的双螺旋结构降解一半时的温度。
一般要求:55℃-65℃。
计算:—对于低于20个碱基的引物,Tm值可根据Tm=4(G+C)+2(A+T)来粗略估算
—对于较长引物,Tm值则需要考虑热动力学参数,从“最近邻位”的计算方式得到,这也是现有的引物设计软件最常用的计算方式。Tm = △H/(△S + R * ln (C/4)) + 16.6 log ([K+]/(1 + 0.7 [K+])) - 273.15
(4)引物的二级结构
引物二聚体(Dimer and Cross Dimer) —尽可能避免两个引物分子之间3’端有有较多碱基互补。
发夹结构 (Hairpin)—尤其是要避免引物3’端形成发夹结构,否则将严重影响DNA聚合酶的延伸。
Hairpin 发卡结构
发卡结构的形成是由于引物自身的互补碱基分子内配对造成,引物折叠形成的二级结构,并由于发卡结构的形成是分子内的反应,仅仅需要三个连续碱基配对。发卡结构的稳定性可以用自由能衡量,自由能大小取决于碱基配对释放的量以及折叠DNA形成发卡环所需要的能量,如果自由能值大于0则该结构不稳定,从而不会干扰反应。如果自由能值小于0 则该结构可以干扰反应。
Dimer 二聚体
引物之间的配对区域能形成引物二聚体,它是相同或不同的两条引物之间形成的二级结构。它造成引物二聚体扩增并减少目的扩增,产物二聚体可以在序列相同的两条引物或正反向引物之间形成,如果配对区域在3 末端问题会更为严重,3 末端配对很容易引起引物二聚体扩增。
(5)引物在模板内应具有单一性,也就是说在模板内部没有错配。如果引物可以结合除目的位点外的其他区域,扩增效率将明显降低,目的产物带将减少。提示:引物设计好后,最好做blast检测,检查同一物种基因组中是否存在高度同源序列。
(6) 设计RT-PCR引物时,引物所在的模板区域应该位于CDS区。因此,设定引物前应对模板序列进行序列分析。
重点的分歧在于引物设计
方法1:序列收索最常用的方法是从NCBI上搜索,选择CDs区,在Primer premier 5.0软件中输入核算序列,SEARCH,
在在结果窗口中给出了程序给该对引物的打分(rating)和上下游引物的起始位置和长度以及产物的长度。通过直接点击各对引物在相应引物搜寻界面中相应的显示引物的各种信息。包括其各种参数和各种可能存在的不利结构。一般预选择分值最高的3-4对引物,再根据引物设计的基本原则进一步筛选。主要观察其序列组成,错配、发夹环或二聚体的位置。将预选择得到的一系列引物分别在GeneBank 中进行回检, 也就是在NCBI 的nucleotide blast 中进行同源性检索。通过blast 弃掉与基因组其他部分同源性比较高的引物, 也就是有可能形成错配的引物。
方法2:从NCBI上搜索,记录CDs区,以及该区域内的exon,选择序列跨越两个exon,长度为18-24bp,为上游,另外选择跨越两个exon,长度为18-24bp,为下游,上下游的长度200-400bp,用Primer premier 5.0软件来查,所选择的序列的Tm值,GC含量,大概要一致。值得注意的是,老师说,对于二聚体以及发夹结构等可以不必过于在意,这是我的有疑问的地方,后面的BLAST一样。还有比如VEGI,从NCBI上搜索得到的基因序列只有部分,没有写出exon。
最后:beta 2 (TGFB2)、TGF A、VEGFC、VEGI,对于以上基因的引物,有哪位同仁之前有设计过的,麻烦发我看看。。。
以上问题,是我不太明白的地方,希望各种师兄师姐给予宝贵的意见。谢谢。
QQ 345202934(完美主义着)
邮箱:nacle1990829@163.com,这是联系方式,希望大家帮忙,再次感谢。