老司机带你一网打尽启动子和转录因子结合位点
生物学霸
如何寻找一个基因的启动子并预测转录因子在其上的结合位点是一个不小的工程,原因有二:
1. 网络上有海量的寻找启动子的教程,各执一词,常常会让小白不知所措;
2. 同理,转录因子的数据库也有很多,而且不少已经鲜有维护,数据陈旧,使用起来很不方便。
有没有一个数据库能完美地一次解决这两个问题呢?有的!今天给大家介绍的 LASAGNA-Search 2.0 便是一款十分让你省心的在线分析数据库。
一、首先,打开数据库的网址:
http://biogrid-lasagna.engr.uconn.edu/lasagna_search/
界面十分的简洁,第一部分是选择计算的模型以及需要进行匹配的转录因子,第二部分是选择启动子,第三部分是结果的过滤选项,可以调整 P 值,获得自己所需的结果。
二、首先我们是要选定进行匹配的转录因子模型,如果有确定的转录因子,如这里我们选择 E2F 作为范例,点击搜索,按照物种排序,选中 Homo Sapiens,勾选方框,然后关闭窗口。
三、导入启动子序列。有两种方式可选,第一种是自己键入 FASTA 序列,第二种是从数据库取回序列,显然第二种更为方便。
我们以 MDM2 为例,search 并将物种限定在 Homo Sapiens,这里可以看出,软件默认的启动子区是 TSS 上游 450 bp 加上 TSS 区的 50 bp 组成,如果需要可以自行调整(这里的 TSS 是数据库自动从 UCSC 中获取的),勾选方框,选中该启动子区,然后关闭窗口,点击 start searching,便能在新窗口中获取结果。
四、结果中便能看到 E2F 与 MDM2 启动子区结合的位点,以及预测模型的分数、P 值、E 值,P 值与 E 值通常越小越好,所以相比之下,199 这个位点可信度更高,看分数也能判断出来,点击「Display results as images」还能获取图像化的信息。
五、点击「Promoter view」选项卡,可以看到 TSS 的具体位置:
六、如果我们不确定是哪些转录因子会与启动子区结合,想筛选转录因子的话,我们可以在转录因子选项里选择多个转录因子进行匹配。
相比于矩阵模型,LASAGNA 因为少了蛋白序列向矩阵的转化,更为准确一点,这里我们就选择 TRANSFAC 数据库,点击后会弹出选项卡,选定物种,勾选 all,然后关闭窗口。
可以看到一共有 68 个转录因子模型被选中。
七、启动子板块的选项不变,我们重新搜索一下,便可以看到更为齐全的转录因子位点筛选结果。
更多内容请关注生物学霸微信公众号:shengwuxueba