已知基因序列的获取策略――兼谈引物设计与序列分析
互联网
真核表达载体的选择
-Promoter
Conventional/Tissue-Specific/Inducibl
-Poly (A) tail
-Kozak序列:-9GCCGCCA/GCCAUGG+4
一个载体内的多基因表达
-IRES系统
-加linker直接融合表达
-多个独立的表达 cassettes:优于共转染表达
-SOE技术与基因人工合成及多基因融合
-基因设计与人工合成中的密码子优化
DNAWorks 2.4 (Hoover, D. and Lubkowski, J., 2002)http://mcl1.ncifcrf.gov/dnaworks/
SOE:Spliced by overlapping extension
搭桥技术融合基因
一、引物设计
引物设计的3条基本原则:
-引物与模板的序列要紧密互补
-引物与引物之间避免形成稳定的二聚体或发夹结构,
-引物不能在模板的非目的位点引发DNA聚合反应(即错配)。
引物设计注意事项
-引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38bp。
-引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。
-引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。
-5’端序列的修饰与标记:可在引物设计时加上限制酶位点、核糖体结合位点、起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等. 通常应在5‘端限制酶位点外再加1-3个保护碱基。
-简并引物:应选用简并程度低的密码子, 例如选用只有一种密码子的Met, 3’端应不存在简并性。否则可能由于产量低而看不见扩增产物。
-同源性或互补性:两引物间最好不存在4个连续碱基的同源性或互补性。
-GC含量:一般为40-60%。另外,上下游引物的GC含量不能相差太大。
-Tm值:引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。有多种计算方法,如按公式Tm=4(G+C)+2(A+T),在软件中常使用的是最邻近法(the nearest neighbor method) 。
-△G值:指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端△G值较低(绝对值不超过9),而5’端和中间△G值相对较高的引物。引物的3’端的△G值过高,容易在错配位点形成双链结构并引发DNA聚合反应。引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。
Primer Premier 5.0
引物设计
限制性内切酶位点分析
DNA基元(motif)查找
同源性分析
Oligo6.69
二、测序图比对、拼接与虚拟克隆(in silico cloning)
常用本地软件:Clone manager、Vector NTI、DNAstar和ds-Gene等
在线工具:BLAST等
常用序列拼接软件
-DNAstar 的SeqMan模块
-VectorNTI程序的Contig Express模块
-Sequencher
导入后可以双击查看和编辑各个测序结果
选择序列,根据实际情况调整序列末端
选择序列拼接
双击查看结果
输出结果到剪贴板,注意最上面的像机按钮,直观吧。
输出结果
真核表达载体的选择
-Promoter
Conventional/Tissue-Specific/Inducible
-Poly (A) tail
-Kozak序列:-9GCCGCCA/GCCAUGG+4
一个载体内的多基因表达
-IRES系统
-加linker直接融合表达
-多个独立的表达 cassettes:优于共转染表达
-SOE技术与基因人工合成及多基因融合
-基因设计与人工合成中的密码子优化
DNAWorks 2.4 (Hoover, D. and Lubkowski, J., 2002)http://mcl1.ncifcrf.gov/dnaworks/
SOE:Spliced by overlapping extension
搭桥技术融合基因
三、引物设计
引物设计的3条基本原则:
-引物与模板的序列要紧密互补
-引物与引物之间避免形成稳定的二聚体或发夹结构,
-引物不能在模板的非目的位点引发DNA聚合反应(即错配)。
引物设计注意事项
-引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38bp。
-引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。
-引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。
-5’端序列的修饰与标记:可在引物设计时加上限制酶位点、核糖体结合位点、起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等. 通常应在5‘端限制酶位点外再加1-3个保护碱基。
-简并引物:应选用简并程度低的密码子, 例如选用只有一种密码子的Met, 3’端应不存在简并性。否则可能由于产量低而看不见扩增产物。
-同源性或互补性:两引物间最好不存在4个连续碱基的同源性或互补性。
-GC含量:一般为40-60%。另外,上下游引物的GC含量不能相差太大。
-Tm值:引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。有多种计算方法,如按公式Tm=4(G+C)+2(A+T),在软件中常使用的是最邻近法(the nearest neighbor method) 。
-△G值:指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端△G值较低(绝对值不超过9),而5’端和中间△G值相对较高的引物。引物的3’端的△G值过高,容易在错配位点形成双链结构并引发DNA聚合反应。引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。
Primer Premier 5.0
引物设计
限制性内切酶位点分析
DNA基元(motif)查找
同源性分析
Oligo6.69
四、测序图比对、拼接与虚拟克隆(in silico cloning)
常用本地软件:Clone manager、Vector NTI、DNAstar和ds-Gene等
在线工具:BLAST等
常用序列拼接软件
-DNAstar 的SeqMan模块
-VectorNTI程序的Contig Express模块
-Sequencher
导入后可以双击查看和编辑各个测序结果
选择序列,根据实际情况调整序列末端
选择序列拼接
双击查看结果
输出结果到剪贴板,注意最上面的像机按钮,直观吧。
输出结果
PDF全文下载:http:///bbs/viewthread.php?tid=22734