【交流】寡核苷酸的优化设计方案
丁香园论坛
1524
在核酸分子杂交、DNA序列测定和通过PCR放大DNA片段等实验中,都需要使用寡核苷酸作为探针或引物,而对这些反应的质量起最重要影响作用的,就是这些寡核苷酸探针或引物。用优化的寡核苷酸进行实验能够很快得到好的结果,而用不够合适的寡核苷酸时,常常得出似是而非的结果,不仅大大增加了后续实验的工作量,还可能一无所获。
怎样优化设计寡核苷酸呢?至少有下列几个方面的问题需要考虑。
1. 估测可能形成的DNA或RNA双链的稳定性 寡核苷酸,无论是DNA的或者RNA的,都有形成双链结构的潜在可能性,正如下面反复提到的,这种结构对寡核苷酸的作用有很大影响。所以,预测这种结构的稳定性对设计和优化寡核苷酸就很重要。在一个双链结构中,碱基对的相对稳定性是由其邻近碱基决定的。在热动力学中,这样的性质以双链形成时的自由能(ΔG)来表示。现在,大多采用 Breslauer等人提出的,以最接近的相邻核苷酸的动力学数值(自由能)来预测双链稳定性的方法。为简化起见,所有的计算都在25 ℃条件下进行。此时,最接近的相邻核苷酸的自由能是:第一个(5′)核苷酸 第二个核苷酸 dA dC dG dT dA -1.9 -1.3 -1.6 -1.5 dC -1.9 -3.1 -3.6 -1.6 dG -1.6 -3.1 -3.1 -1.3 dT -1.0 -1.6 -1.9 -1.9 ΔG(kcal/mol) 例如,双链d(ACGG/CCGT)的ΔG是: ΔG(ACGG)=ΔG(AC) ΔG(CG) ΔG(GG)=-(1.3 3.6 3.1)=-8.0 kcal/mol 此计算方法特别适用于测定其3′末端会形成双链的引物的相容性。也可以用来计算发夹环结构的ΔG。不过,这时需要根据环区内核苷酸的数量添加一定的数值。如3个核苷酸时为5.2 kcal/mol;4个时为4.5;5个为4.4;6个是4.3;7和8个为4.1 kcal/mo1。
2. 选择引物的一般规则 设计和选择引物时有5个要素必需注意。
2.1 引物的3′末端不互补 引物的3′末端一定不能有很大的互补性,因为它们的互补会形成引物二聚体,这就会带来很大的问题,例如合成出非专一的产物,极大地减少所期望产物的得量。有实验表明,3′末端双链的ΔG是0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%,到-8时少于20%,而-10时,接近于0。虽然产量还取决于其他参数,如退火温度、引物的专一性等等,但是用Taq聚合酶操作时,由于它的工作能力很强,能够在很短的时间内就识别3′末端互补的双链区并发动聚合反应,即使3′末端双链的稳定性很差也不能阻碍它的作用,所以这时产量对二聚体的形成就有很大的依赖性。
2.2 引物分子内不互补 应当尽量不用会通过释放能量而形成分子内双链结构的寡核苷酸。虽然有些带有发夹环,其ΔG为-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。
2.3 引物的组分、解链温度和长度 普遍认为PCR引物应当有50%的GC/AT比率。其实,这是不对的。以人基因组DNA为模板,用81% AT的引物可以产生单一的,专一的,长250 bp,含有70% AT的产物。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比。 要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。差异越小,PCR的效率越高。因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。如果期待的产物长度等于或小于500 bp,选用短的(16~18 mer)的引物:若产物长5 kb,则用24 mer的引物。有人用20~23 mer引物得到40 kb的产物。但是,引物较长时,如果不借助引物选择的计算机软件帮助,就很难确定一对引物是否会形成二聚体,是否有自身互补性以及专一性如何。于是,用眼睛选出来的寡核苷酸放大长片段DNA时就会使引物彼此引发而不是延伸模板,得出非专一产物。通过下述的观察内部稳定性原理可以极大地减少这种问题。
2.4 引物的内部稳定性 在DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。 如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。还要注意的是PCR反应产物的质量还取决于模板(底物的复杂性、Tm、产物长度)和退火的温度与时间。 所以,有时3′末端稳定的引物也可以满意地进行反应。但是,无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9 kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。
2.5 引物的唯一性 为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板中没有重复序列。虽然不会整个引物序列都偏好于和模板中的一个以上位点匹配,但是,通常见到的引物的3′末端往往都有6~7个没有什么个性的核苷酸。如果假引发的位点正好在放大区的内部,那麻烦就大了。由于短的DNA片段有更高的PCR或杂交效率,就容易产生非专一产物。 如果用哺乳动物基因组序列作为模板,可以用Alu序列或其他短重复元件来核对想用的引物的互补性。由此也可知,应当避免使用同寡聚物(如—AAAAAA—)和二核苷酸重复(如—ATATAT—)。
3. 按照氨基酸序列设计寡核苷酸 按照多肽的氨基酸序列来设计 PCR引物或杂交探针是最常用的实验手段,尤其是在试图“钓取”一个蛋白质的基因时。
此时要注意的问题有:
(1)宁可用简并引物,也不用猜测的引物。氨基酸密码子的简并性给予引物设计以可塑性,这比用猜测的密码子要好得多。有人用1 024个简并引物得到很好的结果。 但是,应当避免在一个区域内有很高的简并性。但也有简并性低使引物不工作的报道。
(2)引物与模板的错配。一般认为,所用引物与模板有15%~20%的错配,PCR的效果还能接受。但是,引物3′末端的错配比同样错配率的5′末端错配会引起更严重的问题。 在最后4个碱基中有2个错配的引物,其 PCR产量急剧下降。但是,当核苷酸浓度高时,3′末端有错配的引物还能被Tag聚合酶很好地利用。在0.8 mmol/L时,大多数3′末端错配引物可以接受,虽然非专一产物比较多,DNA合成的忠实性也下降。即使在低核苷浓度下,还会有少量从错配碱基出发的合成,因此,在开始的PCR循环中把退火时间增加到3~5分钟,比之于用标准退火时间和高浓度核苷酸能够产生质量更好的所求产物。
(3)在用唯一性引物时,建议用0.2 mmol/L或更低的总核苷酸浓度,因为高浓度会增加错误参入的比率。
(4)简并寡核苷酸时,PCR应当在比较高的引物浓度下进行,即1~3 μmol/L而不是0.2 μmol/L,因为在反应混合物中的大多数寡聚物并不是被用来引发专一的反应,而只是产生高的背景而已。
怎样优化设计寡核苷酸呢?至少有下列几个方面的问题需要考虑。
1. 估测可能形成的DNA或RNA双链的稳定性 寡核苷酸,无论是DNA的或者RNA的,都有形成双链结构的潜在可能性,正如下面反复提到的,这种结构对寡核苷酸的作用有很大影响。所以,预测这种结构的稳定性对设计和优化寡核苷酸就很重要。在一个双链结构中,碱基对的相对稳定性是由其邻近碱基决定的。在热动力学中,这样的性质以双链形成时的自由能(ΔG)来表示。现在,大多采用 Breslauer等人提出的,以最接近的相邻核苷酸的动力学数值(自由能)来预测双链稳定性的方法。为简化起见,所有的计算都在25 ℃条件下进行。此时,最接近的相邻核苷酸的自由能是:第一个(5′)核苷酸 第二个核苷酸 dA dC dG dT dA -1.9 -1.3 -1.6 -1.5 dC -1.9 -3.1 -3.6 -1.6 dG -1.6 -3.1 -3.1 -1.3 dT -1.0 -1.6 -1.9 -1.9 ΔG(kcal/mol) 例如,双链d(ACGG/CCGT)的ΔG是: ΔG(ACGG)=ΔG(AC) ΔG(CG) ΔG(GG)=-(1.3 3.6 3.1)=-8.0 kcal/mol 此计算方法特别适用于测定其3′末端会形成双链的引物的相容性。也可以用来计算发夹环结构的ΔG。不过,这时需要根据环区内核苷酸的数量添加一定的数值。如3个核苷酸时为5.2 kcal/mol;4个时为4.5;5个为4.4;6个是4.3;7和8个为4.1 kcal/mo1。
2. 选择引物的一般规则 设计和选择引物时有5个要素必需注意。
2.1 引物的3′末端不互补 引物的3′末端一定不能有很大的互补性,因为它们的互补会形成引物二聚体,这就会带来很大的问题,例如合成出非专一的产物,极大地减少所期望产物的得量。有实验表明,3′末端双链的ΔG是0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%,到-8时少于20%,而-10时,接近于0。虽然产量还取决于其他参数,如退火温度、引物的专一性等等,但是用Taq聚合酶操作时,由于它的工作能力很强,能够在很短的时间内就识别3′末端互补的双链区并发动聚合反应,即使3′末端双链的稳定性很差也不能阻碍它的作用,所以这时产量对二聚体的形成就有很大的依赖性。
2.2 引物分子内不互补 应当尽量不用会通过释放能量而形成分子内双链结构的寡核苷酸。虽然有些带有发夹环,其ΔG为-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。
2.3 引物的组分、解链温度和长度 普遍认为PCR引物应当有50%的GC/AT比率。其实,这是不对的。以人基因组DNA为模板,用81% AT的引物可以产生单一的,专一的,长250 bp,含有70% AT的产物。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比。 要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。差异越小,PCR的效率越高。因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。如果期待的产物长度等于或小于500 bp,选用短的(16~18 mer)的引物:若产物长5 kb,则用24 mer的引物。有人用20~23 mer引物得到40 kb的产物。但是,引物较长时,如果不借助引物选择的计算机软件帮助,就很难确定一对引物是否会形成二聚体,是否有自身互补性以及专一性如何。于是,用眼睛选出来的寡核苷酸放大长片段DNA时就会使引物彼此引发而不是延伸模板,得出非专一产物。通过下述的观察内部稳定性原理可以极大地减少这种问题。
2.4 引物的内部稳定性 在DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。 如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。还要注意的是PCR反应产物的质量还取决于模板(底物的复杂性、Tm、产物长度)和退火的温度与时间。 所以,有时3′末端稳定的引物也可以满意地进行反应。但是,无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9 kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。
2.5 引物的唯一性 为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板中没有重复序列。虽然不会整个引物序列都偏好于和模板中的一个以上位点匹配,但是,通常见到的引物的3′末端往往都有6~7个没有什么个性的核苷酸。如果假引发的位点正好在放大区的内部,那麻烦就大了。由于短的DNA片段有更高的PCR或杂交效率,就容易产生非专一产物。 如果用哺乳动物基因组序列作为模板,可以用Alu序列或其他短重复元件来核对想用的引物的互补性。由此也可知,应当避免使用同寡聚物(如—AAAAAA—)和二核苷酸重复(如—ATATAT—)。
3. 按照氨基酸序列设计寡核苷酸 按照多肽的氨基酸序列来设计 PCR引物或杂交探针是最常用的实验手段,尤其是在试图“钓取”一个蛋白质的基因时。
此时要注意的问题有:
(1)宁可用简并引物,也不用猜测的引物。氨基酸密码子的简并性给予引物设计以可塑性,这比用猜测的密码子要好得多。有人用1 024个简并引物得到很好的结果。 但是,应当避免在一个区域内有很高的简并性。但也有简并性低使引物不工作的报道。
(2)引物与模板的错配。一般认为,所用引物与模板有15%~20%的错配,PCR的效果还能接受。但是,引物3′末端的错配比同样错配率的5′末端错配会引起更严重的问题。 在最后4个碱基中有2个错配的引物,其 PCR产量急剧下降。但是,当核苷酸浓度高时,3′末端有错配的引物还能被Tag聚合酶很好地利用。在0.8 mmol/L时,大多数3′末端错配引物可以接受,虽然非专一产物比较多,DNA合成的忠实性也下降。即使在低核苷浓度下,还会有少量从错配碱基出发的合成,因此,在开始的PCR循环中把退火时间增加到3~5分钟,比之于用标准退火时间和高浓度核苷酸能够产生质量更好的所求产物。
(3)在用唯一性引物时,建议用0.2 mmol/L或更低的总核苷酸浓度,因为高浓度会增加错误参入的比率。
(4)简并寡核苷酸时,PCR应当在比较高的引物浓度下进行,即1~3 μmol/L而不是0.2 μmol/L,因为在反应混合物中的大多数寡聚物并不是被用来引发专一的反应,而只是产生高的背景而已。