【原创】多重PCR引物设计 (1) ——模板序列预处理
丁香园论坛
3233
文 / 屈武斌 (quwubin@gmail.com)
[原文链接: http://biflife.blog.163.com/blog/static/1398155822011113004945197/]
多重PCR引物设计,一个重要的方面在模板序列的预处理,处理好了后面的引物设计将事半功倍。
问题:假设我们要对6个模板(基因)序列设计6对引物,每对引物特异性的扩增特定的模板序列。针对这一问题,首先我们要设计6对引物,这6对引物要在一个体系中反应,因此彼此之间不能产生二聚体,最好它们的最佳退火温度相同,不能发生非特异扩增。
要实现上面的目标,比较复杂,这里先从最基础的来说,即模板序列的预处理,那么具体如何操作?为什么要进行这些预处理?
1. 过滤序列中的低复杂度区域(Low complexity region)
例如“GTAGTCAGTAGACNATGACNACTGACGATGCAGACNACACACACACACACAGCACACAGGTATTAGTGGGCCATTCGATCCCGA
CCCAAATCGATAGCTACGATGACG”,这段序列中有一段CA重复区域(红色表示),模板序列预处理时,一般需要将这段序列标记为N,这样引物设计程序在寻找候选引物的时候就会跳过这一段区域。
如果不过滤,则会带来非特异的问题,假如引物的3’端落在这一区域,那么引物的3’端将在这一区域有很多的结合位点,在引物与模板的反应中,会大大降低引物与模板杂交的效率。现在普遍认为引物3’端对引物的特异性起决定作用。
低复杂度过滤程序,可以使用BLAST+程序包中自带的dustmasker命令行程序。
2. 避免在序列重复序列区域设计引物
图1所示的黄色区域即为三个重复序列区域,在引物设计时,需要避免上、下游引物落在这些区域上。比如,我们设计的引物是黑色表示的FP (Forward primer) 和RP (Reverse Primer),但是RP落在其中的一个重复区域上,那么在其他的重复区域,该RP也可以很好的结合,因此就会出现图1所示的非特异扩增,将会出现3个长度不等的扩增产物。
重复序列区域鉴定程序可以使用EMBOSS套件中的etandem命令行程序。
<center> 图 1 重复区域非特异扩增示意图</center>
3. 寻找模板间的Unique区域
Unique区域指的是这一区域上的序列在其他模板上没有相似序列。
正常情况下,最好在这些区域上设计引物,这样可以保证引物不会在目标模板序列之外的模板上有结合位点。
注意:这里只能保证引物在这些模板序列之间的特异性,不能保证在实际的PCR环境中引物与背景DNA的非特异结合(这是另外一个话题,在后面的多重PCR引物设计过程中需要考虑)。
Unique区域的寻找可以通过BLAST来实现,但是BLAST结果一般比较繁琐,不能直接得到哪些区域可以设计引物,哪些区域必须避开等信息,需要写一些程序来辅助分析。
至此,通过上面的分析,基本上一般会导致多重引物设计的区域都会排除,对于后面的多重PCR引物设计将非常有利。
[原文链接: http://biflife.blog.163.com/blog/static/1398155822011113004945197/]
多重PCR引物设计,一个重要的方面在模板序列的预处理,处理好了后面的引物设计将事半功倍。
问题:假设我们要对6个模板(基因)序列设计6对引物,每对引物特异性的扩增特定的模板序列。针对这一问题,首先我们要设计6对引物,这6对引物要在一个体系中反应,因此彼此之间不能产生二聚体,最好它们的最佳退火温度相同,不能发生非特异扩增。
要实现上面的目标,比较复杂,这里先从最基础的来说,即模板序列的预处理,那么具体如何操作?为什么要进行这些预处理?
1. 过滤序列中的低复杂度区域(Low complexity region)
例如“GTAGTCAGTAGACNATGACNACTGACGATGCAGACNACACACACACACACAGCACACAGGTATTAGTGGGCCATTCGATCCCGA
CCCAAATCGATAGCTACGATGACG”,这段序列中有一段CA重复区域(红色表示),模板序列预处理时,一般需要将这段序列标记为N,这样引物设计程序在寻找候选引物的时候就会跳过这一段区域。
如果不过滤,则会带来非特异的问题,假如引物的3’端落在这一区域,那么引物的3’端将在这一区域有很多的结合位点,在引物与模板的反应中,会大大降低引物与模板杂交的效率。现在普遍认为引物3’端对引物的特异性起决定作用。
低复杂度过滤程序,可以使用BLAST+程序包中自带的dustmasker命令行程序。
2. 避免在序列重复序列区域设计引物
图1所示的黄色区域即为三个重复序列区域,在引物设计时,需要避免上、下游引物落在这些区域上。比如,我们设计的引物是黑色表示的FP (Forward primer) 和RP (Reverse Primer),但是RP落在其中的一个重复区域上,那么在其他的重复区域,该RP也可以很好的结合,因此就会出现图1所示的非特异扩增,将会出现3个长度不等的扩增产物。
重复序列区域鉴定程序可以使用EMBOSS套件中的etandem命令行程序。
<center> 图 1 重复区域非特异扩增示意图</center>
3. 寻找模板间的Unique区域
Unique区域指的是这一区域上的序列在其他模板上没有相似序列。
正常情况下,最好在这些区域上设计引物,这样可以保证引物不会在目标模板序列之外的模板上有结合位点。
注意:这里只能保证引物在这些模板序列之间的特异性,不能保证在实际的PCR环境中引物与背景DNA的非特异结合(这是另外一个话题,在后面的多重PCR引物设计过程中需要考虑)。
Unique区域的寻找可以通过BLAST来实现,但是BLAST结果一般比较繁琐,不能直接得到哪些区域可以设计引物,哪些区域必须避开等信息,需要写一些程序来辅助分析。
至此,通过上面的分析,基本上一般会导致多重引物设计的区域都会排除,对于后面的多重PCR引物设计将非常有利。