如何利用CisGenome和Galaxy软件做Motif分析
互联网
- 相关专题
基因组数据显示软件Cisgen ome功能强大,是个免费的分析数据库。最近要做预测调控元件相关的毕业设计,需要做个Motif分析,选择了CisGenome,但是CisGenome挖掘Motif又只接受Sequence输入,于是又利用了Galaxy,在此记录下我是如何利用Galaxy和CisGenome做Motif分析的。
如果你现在得到元件数据格式如下:
Chr Start end
chr1 100276118 100276403
chr1 101106565 101106850
chr1 101159289 101159574
chr1 101442245 101442530
chr1 101526611 101526896
chr1 101595570 101595855
chr1 101693374 101693659
chr1 101744747 101745032
chr1 102007721 102008006
chr1 10192856 10193141
Galaxy
若你想得到这些元件所对应具体的序列信息是什么,你可以使用Galaxy。地址:http://main.g2.bx.psu.edu/
用法呢很简单,简单介绍一下吧:
看左侧边工具tool栏
点击Get Data
导入你的元件 其它默认 值得一提的是注意选择你的基因组 版本 例如我的是:Hg18
我们不是想提取序列信息么,那么我们下面就选择Fetch Sequences工具
然后进去你就知道怎么用了。。不在啰嗦。。
输出的结果通常以Fasta给出
下载结果的话点击右侧边栏History
你会看到你的结果详情 点击结果看下面有一个保存的小图标 保存即可~
有了Seq,下面我们就可以挖掘它的Motif了,简单说下:
CisGenome
1.首先当然还是得导入你的数据喽,即我们刚通过Galaxy得到的Fasta文件。
File--load data--seqence--你的文件路径
2.然后我们选择Motif--New Motif Discovery--Gibbs Motif Sampler
如下:
<center> <img alt="如何利用CisGenome和Galaxy软件做Motif分析" src="http://img.dxycdn.com/trademd/upload/asset/meeting/2013/09/06/A1378380391.jpg" /></center>3.弹出对话框,选择你要分析的序列文件及其输出路径文件
<center> <img alt="如何利用CisGenome和Galaxy软件做Motif分析" src="http://img.dxycdn.com/trademd/upload/asset/meeting/2013/09/06/A1378380392.jpg" /></center>4.再选择 Advanced Option 高级选项,设置你的参数:
输出Motif的个数、Motif的平均长度、Motif允许的最大长度
其它默认 然后OK
<center> <img alt="如何利用CisGenome和Galaxy软件做Motif分析" src="http://img.dxycdn.com/trademd/upload/asset/meeting/2013/09/06/A1378380394.jpg" /></center>5.然后会弹出一个cmd的黑框。。表示程序已经开始运行。。当运行结束后,输出结果
如下,我们的Motif都在Mat里面,直接双击即可见。
<center> <img alt="如何利用CisGenome和Galaxy软件做Motif分析" src="http://img.dxycdn.com/trademd/upload/asset/meeting/2013/09/06/A1378380393.jpg" /></center>提醒一下:在用CisGenome的时候很多同学说怎么点击OK了以后不运行呢
请注意一下,在使用前先配置好CisGenome
在这个CisGenome.ini文件里面配置
设置好你的CisGenome.exe所在的路径
例如我的:CisGenome=E:xiaenhuaProcisgenome_v2.0cisgenome_v2.0(注:=之前和之后别有任何空格)
同时注意使用CisGenome的时候所有的路径名、文件夹名也别有任何空格
备注:Galaxy 网址:https://main.g2.bx.psu.edu/, CisGenome 网址:http://www.biostat.jhsph.edu/~hji/cisgenome/