一招搞定启动子序列查找
丁香园
在研究基因转录调控的过程中,科研汪经常需要构建某个基因启动子的荧光素酶报告质粒或者预测与某基因启动子结合的转录因子,无论哪种,首先得查找到某基因的启动子序列。
能查到启动子序列的网站很多,pubmed,ensemble,UCSC 等等,可是这些网站气场太强大,小白 hold 不住,看得还是很迷糊,肿么破?别担心,这里有一个界面超级友好的网站,可以快速简单的查到到启动子序列,即:
The eukaryotic promoter database(EPD)真核启动子数据库
EPD 是一种注释非冗余的真核 POL II 启动子集,其转录起始位点已经通过实验确定。该数据库包含来自多个真核生物物种的启动子信息。具体操作方法如下:
Step1
打开网站
网址可直接用搜索引擎搜索,或在「生物学霸」后台对话框回复「EPD」。
Step2
输入所查基因的基因名(这里的基因名是指 gene symbol 哦,也就是基因的官方大名)以及选择物种,点击 search
Step3
点击所要查找的基因
Step4
进入所查基因信息的详细信息界面
Step5
在 Retrive Sequence 下面输入想要查找的启动子序列起始和终止位置,点击 get sequence 即可。
同时,也能在 search motif 下拉菜单中查找 TATA-box,GC-box 及 CCAAT-box。
这样启动子序列就查到啦,欲知如何进行转录因子预测,请听下回分解~~
作者:小草
图片来源:小草
题图来源:丁香通