丁香实验_LOGO
登录
提问
提问
我要登录
|免费注册
丁香通
点赞
收藏
wx-share
分享

序列比对

相关实验:比较基因组常用分析方法

别名:Sequence alignment

最新修订时间:

简介

序列比对是比较基因组分析中的一项常规分析,目的是分析序列间的差异,获得序列间的相似度、相似区段等信息,为推断序列的功能、结构和进化等方面的信息提供参考。

原理

序列比对的基本原理是采用了局部比对算法,能快速地在序列库中找寻出同源序列,可以用于氨基酸或核苷酸序列间的序列相似性分析。

材料与仪器

序列比对工具:BLAST (Basic Local Alignment Search Tool)、FASTA 等。

步骤

BLAST+序列检索的基本过程可分为如下几步:


A. 解压程序。首先创建文件夹,如: D;\blast +。将 ncbi-blast-2.2.28+ -ia-win32.targ 放入该文件夹,解压产
生 bin、doc 两个目录以及一些文件。bin 目录中存放的文件是已经编译好的 BLAST+程序,doc 目录中存放的是帮助文档。

B. 设置程序环境变量。有多种方法可以让系统知道 BLAST+程序的位置。

一种方法是将 BLAST+程序放置到当前工作目录下。

第二种方法是在 Dos 中用 path 命令设置 BLAST+程序的路径。方法是: 击"开始",选择"运行",输入"cmd", 回车后就可以进入 DOS 窗口。然后输入;path d;\blast+ \ncbi-blast-2.2.28+\bin。这种方法的缺点是关闭 DOS 窗口后需要进行重新设置。第三种方法是在 Windows 的环境变量中进行设置,这种是推荐的方法。方法是: 在"我的电脑"上点击右键,进入属性,击"高级"-→"环境变量",双击系统变量 Path, 在变量值的后面增加 BLAST+程序所在路径 d;Mblast+ \ncbi-blast-2.2.28+bin, 此时点击"新建"一变量名"BLASTDB",变量值为"D : \blast+\db" (即数据库路径) (图 11-3-1) 。启动 Windows 命令行界面,进入到当前 bin 目录,输入 blastn-version 命令,即可查看版本,若如图 11-3-2 所示,则说明程序完好,可以运行。


C. 本地数据库的构建
①数据的获取。一种方法是直接从 NCBI 或者其他数据库网站下载所需序列,或者用自己已有的测序数据,做成数据库,数据必须是 fasta 格式。第二种方法是从 NCBI 中的 ftp 库下载所需要的某一个库或几个库。第三种方法是利用新版 BLAST+自带的 update_ blastdb.pli 进行 下载,在用这个程序时需要下载安装 perl 程序。之后可依次输入下述命令: perlup_ blastdb. pl;perl up_ blastdb.pl-show 来查看操作帮助以及 NCBI 中的库; 键入相应的命令即可下载载体库。直到后面出现 done 表示 E 经下载完毕。如果下载其他数据库,可将上面 perl up_ blastdb.pl vector 中的 vector 换成其他数据库的名字即可。
②数据的格式化。以 GPR32 Human.fasta 作为查询序列,以 GPR32.fasta 作为数据库文件为例进行讲解。首先将 GPR32.fasta 放到 D : blast+\db 文件夹下,然后调出 MS-DOS 命令行,转到 D : \blast+ \db 文件夹下运行以下命令:makeblastdb.exe -in GPR32.fasta -parse seqids -hash_ index-dbtype prot 其中"-in"参数后面是要格式化的数据库, "-parse seqids, -hash index'这两个参数是为 blastdbemd 取子列时使用," -dbtype"后是所格式化的序列的类型,核酸用 nucl, 蛋白质用 prot; 如图 11-3-3 所示。

③序列间的相似性检索。将 GPR32_ Human.fasta 放到 D : blast+文件夹下,然后调出 MS-DOS 命令行, 转到 D : \blast+文件夹下运行以下命令:blastp.exe -task blastp-query GPR32_ Human.fasta-db GPR32.fasta -out outtext.txt

其中"blastp.exe "表示程序执行命令,"exe"之 前的程序可根据自己的需要而更换;"-task"后面是你所要用的程序,如: blastn, blatp, tblastx 等;"-query"后面接查询序列的文件名称;"-db"后面接格式化好的数据库名称;"-out"后面是要输出的文件名称及格式。结果如图 11-3-4 所示。

来源:丁香实验

提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
关注公众号
反馈
TOP
打开小程序