蛋白质序列分析路线图和工具推荐
互联网
- 相关专题
当我们得到一段蛋白质序列时,通常要做的第一步就是对其进行结构分析。现在,不少数据库和网站都会提供各种蛋白分析的工具和网站,不过,用起来怎样就必须靠运气了,下面介绍3种蛋白质结构分析的工具。
1、跨膜区预测
各个物种 的膜蛋白的比例差别不大,约四分之一的人类已知蛋白为膜蛋白。由于膜蛋白不溶于水,分离纯化困难,不容易生长晶体,很难确定其结构。因此,对膜蛋白的跨膜螺旋进行预测是生物信息学的重要应用。
推荐使用TMHMM软件对蛋白进行跨膜预测。TMHMM综合了跨膜区疏水性、电荷偏倚、螺旋长度和膜蛋白拓扑学限制等性质,采用隐马氏模型(Hidden Markov Models),对跨膜区及膜内外区进行整体的预测。
TMHMM是目前最好的进行跨膜区预测的软件,它尤其长于区分可溶性蛋白和膜蛋白,因此首选它来判定一个蛋白是否为膜蛋白。所有跨膜区预测软件的准确性都不超过52%,但86%的跨膜区可以通过不同的软件进行正确预测。因此,综合分析不同的软件预测结果和疏水性图以获得更好的预测结果。
方法:输入待分析的蛋白序列即可。
2、信号肽预测
信号肽位于分泌蛋白的N端,当蛋白跨膜转移位置时被切掉。信号肽的特征是包括一个正电荷区域、一个疏水性区域和不带电荷但具有极性的区域。信号肽切割位点的-3和-1位为小而中性氨基酸。
推荐使用SignalP软件2.0版对PDCD5N端序列进行信号肽分析。SignalP2.0根据信号肽序列特征,采用神经网络方法或隐马氏模型方法,根据物种 的不同,分别选择用真核和原核序列进行训练,对信号肽位置及切割位点进行预测。
信号肽切割位点预测用Y-score maximum来判断,对是否分泌蛋白用mean S-score来判断:如果mean S-score大于0.5,则预测为分泌蛋白,存在信号肽,但II型跨膜蛋白的N端序列可能被错误预测为分泌蛋白的信号肽。
方法:输入待分析的蛋白序列,如为原核基因选择原核训练集,否则选择真核训练集。
3、亚细胞定位预测
亚细胞定位与蛋白质的功能存在着非常重要的联系。亚细胞定位预测基于如下原理:
(1)不同的细胞器 往往具有不同的理化环境,它根据蛋白质的结构及表面理化特征,选择性容纳蛋白。
(2)蛋白质表面直接暴露于细胞器环境中,它由序列折叠过程决定,而后者取决于氨基酸组成。因此可以通过氨基酸组成进行亚细胞定位的预测。
推荐使用PSORT(http://psort.nibb.ac.jp/)II 软件 对PDCD5蛋白的细胞内定位进行预测。PSORT将动物蛋白质定位于10个细胞器:
(1)细胞浆,(2)细胞骨架,(3)内质网,(4)胞外,(5)高尔基体,(6)溶酶体,(7)线粒体,(8)胞核,(9)过氧化物酶体(peroxisome)和(10)细胞膜。