蛋白质二级结构预测-综合各种分析方法预测
互联网
综合各种分析方法预测
在实际进行蛋白质二级结构预测时,往往会综合应用各种分析方法和相关数据。综合方法不仅包括各种预测方法的综合,而且也包括结构实验结果、序列对比结果、蛋白质结构分类预测结果等信息的综合。实际应用中最常见的综合方法是同时使用多个软件进行预测,通过分析各个软件的特点以及各个软件预测结果,最终形成二级结构一致性的预测结果。将序列比对与二级结构预测相结合也是一种常见的综合方法。
双重预测是另一类综合方法,该方法首先预测蛋白质的结构类型,然后根据不同结构类型蛋白质的二级结构形成规律预测新蛋白质的二级结构,并根据结构类型解释预测结果。这种方法若有光谱测定的二级结构含量作参考,则第一步分类结果更可靠。
就像α螺旋和β折叠片的位置可以预测出来一样,其它特定的结构或结构特征,如卷曲螺旋和跨膜区也可以预测出来。但这类预测的方法没有二级结构预测方法多,主要是由于这些结构或结构特征的折叠规律尚不十分清楚。尽管如此,若待预测序列在已知结构数据库中能搜索到相似蛋白,则可以提高预测的准确性。
早期人们建立的多种二级结构的预测方法,都是建立在假定蛋白质的二级结构主要是由局部氨基酸所决定,准确率都不超过65%。随着蛋白质进化信息、长程相互作用信息及全局信息的加入,蛋白质二级结构预测的准确率有了较大的提高。
由于序列信息和结构信息的不断增长,通过统计得到的蛋白质序列与二级结构关系及规律更加全面,同时也由于预测方法的不断改进,使得蛋白质二级结构预测的准确率也在不断地提高,预测二级结构的准确率已经可以达到80%以上。
一般认为,如果蛋白质二级结构预测准确率足够高的话,就可以基本准确地预测一个蛋白质分子的三维空间结构。但目前所取得的成果还难以达到这一目标。虽然二级结构的预测准确率还不能满足准确推测蛋白质分子三维空间结构的要求,但其预测结果仍能提供许多有用结构信息,尤其当蛋白质的结构尚未解出时更是如此。
通过对多种预测结果的综合分析,再结合光谱实验数据,往往可以提高预测的准确度。由于二级结构预测很好地反映了局域序列片段的结构倾向性,因此在进行全新蛋白质设计时,常用二级结构预测的方法来设计二级结构单元。
利用氨基酸残基之间的距离预测
只要给出所有残基之间的距离,就可以利用距离几何或分子动力学方法构建蛋白质的三维结构,这是核磁共振NMR测定分子三维结构的一般方法。那么就蛋白质结构而言,是否能够得到残基之间的距离呢?显然,根据残基间氢键模式可以确定一部分螺旋和折叠的距离。
因此成功的二级结构预测预示着可以得到一部分残基间的距离。然而需要注意的是这些距离仅仅是短程距离,是关于序列中相邻残基间的距离。若用距离几何的方法推测三维结构,还进一步得到关于长程距离的信息。目前预测长程距离的方法还比较少,有两个问题是这类方法所关心的重点,一是这些方法平均预测准确率是多少,二是是否所有主要的距离都被预测出来了?