【原创】简并引物设计与筛选---供新手学习,与高手交流
丁香园论坛
2171
最近一直专注于简并引物的设计。从园子里和其他地方学习了不少,终于也设计出了满意的简并引物。现将全过程一并贴出,以供大家学习交流用。
所用软件:DNAMAN, FastPCR,在线Blockmaker (http://bioinformatics.weizmann.ac.il/blocks/blockmkr/www/make_blocks.html),在线Codehop (http://bioinformatics.weizmann.ac.il/blocks/codehop.html).
我所要研究的是与鱼类性别分化相关的基因dmrt1。这个基因的蛋白质在整个动物界里算是保守的。在鱼类里相当保守。我研究的这条鱼还没有基因的报道,所以没有基因序列可用,只能借助于保守序列设计简并引物来研究了。
1. 在NCBI里查找dmrt1核苷酸序列,挑选一些与研究种亲缘关系较远及较近的序列(比如人、鸡、蟾,然后一些模式动物如斑马鱼等,然后一些亲缘极近的种),找到每一个序列的cds,点击进入蛋白质序列(因为核苷酸序列一般不保守,蛋白质序列才是保守的)。将各个蛋白序列存为fasta格式,或者直接复制到记事本。存为“>序列名 序列“样式,以便于后面查找对照。比如:”>CAQ52797.1 European seabass
MSKDKQSKQVPESTGPLSPSKGQKPPRMPKCSRCRNHGYVSPLKGHKRFCNWRDCQCPKCKLIAERQRVMAAQVALRRQQAQEEELGICSPVALSCPEVMVKNEAGADCLFSVEGRSLTPTSTSTSSLAVTGSRSALSSSPSAVARAHTDGPSDLLLETSYYNFYQPSRYPTYYGNLYNYQQYQEMPHGDGRLSSHNMSSQYRMHSYYPAATYLTQGLGSATCVPPLFSLDDNNNNNNNNNNNNNCSETMAASAFPPGIITTAHDSTMTCRSISSLVNSEIHPECEASSETPNFTVSSIIDDDATK“。
注意要去掉里面所有的空格。
2. 所有的序列保存好了之后就可以进入Blockmaker做block了(我总共选了13个蛋白质序列)。进入http://bioinformatics.weizmann.ac.il/blocks/blockmkr/www/make_blocks.html。简单描述一下你的基因,我写的是dmrt1,然后在”Enter your protein sequences in a single format (e.g. FASTA):“下面的框里粘贴蛋白序列。点maker blocks。然后一般会生成很多个block。会发现block来自两种方法:BLOCKS from MOTIF,BLOCKS from GIBBS。我暂时还不知道这两种有什么区别,如果有高人知道,讲补充。我选用的是第一个方法算出的block。注意把这个结果以网页的形式全部保存起来,后面会用到,也避免结果丢失。然后在下面几行找到Primers:[CODEHOP] [About CODEHOP]。便要进入下一个阶段Codehop,生成primer了。
3. 点codehop,之后有一些参数需要设置,这里我改了两个参数,一个是Codon usage table里的。一般如果没有你要的物种,则选择与研究种亲缘关系最近的物种,我选的是fugu。简并度有选的64。然后点look for primers。可以看到每个block里自动生成了很多primers,有的block里没有。这些简并引物按每个block从后到前的顺序排列。然后就要开始引物的筛选了。
4. 引物的筛选是个繁琐的过程,大家要有耐心。如果codehop给出了几十个primer的话,你就有的可选了。注意先把页面保存了,以便后面查看。这里面生成的primer都有评分。通常先看下TM值,小于60的我直接就去了。然后选择评分较高的,我选的都是大于75的。这样下来,我就选出了11个上游引物和13个下游引物。这个时候问题就来了,1undefined13,这得算多久啊。其间我查了很多资料,也没有哪个地方说有对简并引物进行评价的,像oligo和PP5我都试过,好像不能对简并引物进行评价。
5. 忘记在哪个地方看到了一个叫FastPCR的软件,可以对简并引物进行评估。于是学习FastPCR的用法。实际上现在的软件都面向客户,学习起来还是很快的。FastPCR有两大优点:可以直接对简并引物进行评估,兼容excel格式。这给我们的输入带来了很大的便利。这个软件的所有主要功能都在工具栏下面列出。
[img]file:///C:\Documents and Settings\Administrator\Application Data\Tencent\Users\390157477\QQ\WinTemp\RichOle\L9%Y4{~265[0XSWTZOF%VT4.jpg[/img]
[img]file:///C:\Documents and Settings\Administrator\Application Data\Tencent\Users\390157477\QQ\WinTemp\RichOle\L9%Y4{~265[0XSWTZOF%VT4.jpg[/img]
点primers list analysis,选all against all primers。有人可能要问为什么不选forward against reverse (F/R)这个?很好的问题。选了这个之后,软件只能一对一进行分析,要想我有1undefined13对,这得做到什么时候啊。
在把你的引物粘贴到下面的squence之前,要对引物进行命名,以便对比上下游引物。可以根据自己喜好命名,但要方便你比对整个蛋白序列。我是根据每个block命名的,如d-A4F、d-B6R等,表示block A的第4个上游引物及block B的第6个下游引物。将excel里的引物粘贴过来,选好primer test里的参数。点工具栏最后一个进行分析。
完了之后软件给出了很多参数。如下图。
这个结果可以直接粘贴到excel里,结果很明了。这里的TM值是三种算法取的平均值。后面还有个primer quality,不知道这个是怎么算出来的,在最后可以做个参考。primers dimers analysis里给出了所有上下游引物之间形成dimers的结果及TM值。如下图。
所用软件:DNAMAN, FastPCR,在线Blockmaker (http://bioinformatics.weizmann.ac.il/blocks/blockmkr/www/make_blocks.html),在线Codehop (http://bioinformatics.weizmann.ac.il/blocks/codehop.html).
我所要研究的是与鱼类性别分化相关的基因dmrt1。这个基因的蛋白质在整个动物界里算是保守的。在鱼类里相当保守。我研究的这条鱼还没有基因的报道,所以没有基因序列可用,只能借助于保守序列设计简并引物来研究了。
1. 在NCBI里查找dmrt1核苷酸序列,挑选一些与研究种亲缘关系较远及较近的序列(比如人、鸡、蟾,然后一些模式动物如斑马鱼等,然后一些亲缘极近的种),找到每一个序列的cds,点击进入蛋白质序列(因为核苷酸序列一般不保守,蛋白质序列才是保守的)。将各个蛋白序列存为fasta格式,或者直接复制到记事本。存为“>序列名 序列“样式,以便于后面查找对照。比如:”>CAQ52797.1 European seabass
MSKDKQSKQVPESTGPLSPSKGQKPPRMPKCSRCRNHGYVSPLKGHKRFCNWRDCQCPKCKLIAERQRVMAAQVALRRQQAQEEELGICSPVALSCPEVMVKNEAGADCLFSVEGRSLTPTSTSTSSLAVTGSRSALSSSPSAVARAHTDGPSDLLLETSYYNFYQPSRYPTYYGNLYNYQQYQEMPHGDGRLSSHNMSSQYRMHSYYPAATYLTQGLGSATCVPPLFSLDDNNNNNNNNNNNNNCSETMAASAFPPGIITTAHDSTMTCRSISSLVNSEIHPECEASSETPNFTVSSIIDDDATK“。
注意要去掉里面所有的空格。
2. 所有的序列保存好了之后就可以进入Blockmaker做block了(我总共选了13个蛋白质序列)。进入http://bioinformatics.weizmann.ac.il/blocks/blockmkr/www/make_blocks.html。简单描述一下你的基因,我写的是dmrt1,然后在”Enter your protein sequences in a single format (e.g. FASTA):“下面的框里粘贴蛋白序列。点maker blocks。然后一般会生成很多个block。会发现block来自两种方法:BLOCKS from MOTIF,BLOCKS from GIBBS。我暂时还不知道这两种有什么区别,如果有高人知道,讲补充。我选用的是第一个方法算出的block。注意把这个结果以网页的形式全部保存起来,后面会用到,也避免结果丢失。然后在下面几行找到Primers:[CODEHOP] [About CODEHOP]。便要进入下一个阶段Codehop,生成primer了。
3. 点codehop,之后有一些参数需要设置,这里我改了两个参数,一个是Codon usage table里的。一般如果没有你要的物种,则选择与研究种亲缘关系最近的物种,我选的是fugu。简并度有选的64。然后点look for primers。可以看到每个block里自动生成了很多primers,有的block里没有。这些简并引物按每个block从后到前的顺序排列。然后就要开始引物的筛选了。
4. 引物的筛选是个繁琐的过程,大家要有耐心。如果codehop给出了几十个primer的话,你就有的可选了。注意先把页面保存了,以便后面查看。这里面生成的primer都有评分。通常先看下TM值,小于60的我直接就去了。然后选择评分较高的,我选的都是大于75的。这样下来,我就选出了11个上游引物和13个下游引物。这个时候问题就来了,1undefined13,这得算多久啊。其间我查了很多资料,也没有哪个地方说有对简并引物进行评价的,像oligo和PP5我都试过,好像不能对简并引物进行评价。
5. 忘记在哪个地方看到了一个叫FastPCR的软件,可以对简并引物进行评估。于是学习FastPCR的用法。实际上现在的软件都面向客户,学习起来还是很快的。FastPCR有两大优点:可以直接对简并引物进行评估,兼容excel格式。这给我们的输入带来了很大的便利。这个软件的所有主要功能都在工具栏下面列出。
[img]file:///C:\Documents and Settings\Administrator\Application Data\Tencent\Users\390157477\QQ\WinTemp\RichOle\L9%Y4{~265[0XSWTZOF%VT4.jpg[/img]
[img]file:///C:\Documents and Settings\Administrator\Application Data\Tencent\Users\390157477\QQ\WinTemp\RichOle\L9%Y4{~265[0XSWTZOF%VT4.jpg[/img]
点primers list analysis,选all against all primers。有人可能要问为什么不选forward against reverse (F/R)这个?很好的问题。选了这个之后,软件只能一对一进行分析,要想我有1undefined13对,这得做到什么时候啊。
在把你的引物粘贴到下面的squence之前,要对引物进行命名,以便对比上下游引物。可以根据自己喜好命名,但要方便你比对整个蛋白序列。我是根据每个block命名的,如d-A4F、d-B6R等,表示block A的第4个上游引物及block B的第6个下游引物。将excel里的引物粘贴过来,选好primer test里的参数。点工具栏最后一个进行分析。
完了之后软件给出了很多参数。如下图。
这个结果可以直接粘贴到excel里,结果很明了。这里的TM值是三种算法取的平均值。后面还有个primer quality,不知道这个是怎么算出来的,在最后可以做个参考。primers dimers analysis里给出了所有上下游引物之间形成dimers的结果及TM值。如下图。