基于蛋白质物理性质的蛋白质预测软件
互联网
ExPASy工具包包涵的程序
ComputepI/MW:是ExPASy工具包中的程序,计算输入序列等电点和分子量的工具。对pI的确定基于早期研究中将蛋白质从由中性到酸性变性条件下迁移过程中所获得的pK值(Bjellqvist等,1993)。分子量的计算是把序列中每个氨基酸的同位素平均分子量加在一起,再加上一个水分子的分子量。
用户可以把序列整理为FASTA格式,或提供SWISS-PROT标识,或者是可唯一确定的添加号。若用户提供了序列,该工具会自动计算全序列的pI和分子量;若用户提供的是SWISS-PROT标识,程序会显示该条目的描述和物种记录;如果用户给出了一段序列片段范围则计算将在该片段上进行,而不是针对整个序列。
对于碱性蛋白质,计算出的等电点偏差较大
PeptideMass:是ExPASy工具包中的程序,针对肽段谱图分析实验分析蛋白质在各种蛋白酶和/或化学试剂作用下的内切产物。通过PeptideMass可以预测水解结果的酶和试剂包括:胰蛋白酶(trypsin)、糜蛋白酶(chymotrypsin)、LysC、溴化氰、ArgC、AspN和GluC(双羧酯或磷酸酯)。半胱氨酸和甲硫氨酸可在计算产物肽段前加以修饰。若用户提供的是SWISS-PROT标识,而不单是一段序列,PeptideMass还能利用SWISS-PROT库中标注中的信息协助计算。例如,除去信号序列,后在剪切之前引入已知的翻译后修饰。输出结果会列成表格,其中将给出输入蛋白的pI和分子量,然后是SWISS-PROT中关于变种的分子量、位点、修饰后变种的信息,最后是肽片段的序列。
TGREASE:是FASTA工具包中的程序,沿蛋白质序列长度计算分析其疏水性性。这个程序延序列计算每个残基位点的移动平均疏水性,并给出疏水性-序列曲线,用这个程序可以发现膜蛋白的跨膜区和高疏水性区的明显相关性。TGREASE对预测球状蛋白内埋区以及判断待定跨膜序列等方面都有应用。可从Virginia大学得到,并可以作为独立程序在Mac或Dos系统下运行。
疏水性预测的方法依赖于疏水性的衡量尺度,这里每个氨基酸根据其一系列的物理特性(例如,溶解性、跨越水-汽相时产生的自由能等),被赋予一个数值以代表其疏水性。具有更高正值的氨基酸具有更大的疏水性;而具有更低负值的氨基酸则更加亲水。然后,沿蛋白质序列的疏水性的移动平均值,或者称为亲/疏水性索引被计算出来。窗口的宽度是可以调整的,这里推荐7-11残基的窗口宽度以获得更多的信息和更少的噪声干扰。最后把结果绘制成亲/疏水性-残基序号的线形图。要注意的是这种方法不仅仅预测跨膜区段,还预测所有的疏水区。
蛋白质序列统计分析,对提交的序列给出大量全面的分析数据,包括氨基酸组成统计、电荷分布分析、电荷聚集区域、高度疏水区域、跨膜区段等等。
当一个蛋白序列通过Web界面提交给SAPS,服务器会返回一大堆关于该蛋白的物理和化学性质的信息,这些都是仅仅通过序列本身就可以分析出来的。输出的结果最先是按种类对氨基酸的统计计数;随后是电荷分布分析,包括正/负电荷聚集区的位置,高度带电和不带电区段,以及电荷的传播和模式等;最后的部分给出了高疏水性和跨膜区段、重复结构和多重态、以及周期性分析。