从头预测法预测蛋白质的结构
互联网
7546
从头预测法预测蛋白质的结构
从理论上说,从头预测法是最为理想的蛋白质结构预测方法。它要求方法本身可以只根据蛋白质的氨基酸序列来预测蛋白质的二级结构和高级结构,但现在还不能完全达到这个要求。从头预测可以细分为以下几种类型。
(一)二级结构预测
首先从一级结构预测出二级结构,然后再把二级结构堆积成三维结构。由于目前对二级结构中氨基酸的中远程相互作用不完全清楚,因此预测准确率一般在65%以下。如果具有多种蛋白质同源序列的三维结构,在多重序列匹配比较的情况下,预测的准确性可以达到88%以上。
Barton和Sander等人发现,在一个蛋白质序列中总有约40%序列的预测可以有很好的可信度,其预测的准确性都在80%以上。这些区域都是一些二级结构序列比较保守的部分,这些结果给如何将现有二级结构预测结果应用到三维结构预测提供了有益的启示。
(二)超二级结构预测
实际上是局域的空间结构预测,主要应用人工神经网络方法和向量投影方法,从蛋白质序列出发,直接预测蛋白质的超二级结构。观察此段氨基酸序列是否能形成某一种模式的超二级结构。其中人工神经网络方法预测的准确率在75%~82%,向量投影方法预测的准确率达到85%以上。
(三)结构类型(structureclass)预测
预测的未知结构蛋白质属于何种类型,如全α类蛋白质(主要由α―螺旋组成)、全β类蛋白质(主要由β―折叠组成)、α/β类蛋白质(由α―螺旋和β―折叠交替排列)或α+β类蛋白质(由分开的α―螺旋和β―折叠组成,其中β―折叠一般为平行结构)。
结构类型预测除能了解大概的蛋白质结构折叠情况外,对二级结构的预测也有帮助。方法主要有光谱数据预测、神经网络预测和Mahalanobis距离预测等,后者的准确率较前两者为高,可达94.7%。
(四)三维结构预测
三维蛋白质预测是蛋白质结构预测的最终目标。主要有以下两个方向。
(1)根据二级结构、结构类型和折叠类型预测的结果。结合结构间的立体化学性质、亲疏水性质、氢键以及静电相互作用,把可信度较高的二级结构进一步组装,搭建出最后的蛋白质结构。由于该方法主要依赖于前面的预测结果,所以受到的限制很多。
(2)不依赖二级结构预测的结果,直接预测三维结构。主要方法是有效收集构象空间以及区分天然结构和错误结构。
根据对天然蛋白质结构与功能分析建立起来的数据库里的数据,可以预测一定氨基酸序列肽链空间结构和生物功能;反之,也可以根据特定的生物功能,设计蛋白质的氨基酸序列和空间结构。
通过基因重组等实验可以直接考察分析结构与功能之间的关系;也可以通过分子动力学、分子热力学等,根据能量最低、同一位置不能同时存在两个原子等基本原则分析计算蛋白质分子的立体结构和生物功能。
虽然这方面的工作尚在起步阶段,但可预见将来能建立一套完整的理论来解释结构与功能之间的关系,用以设计、预测蛋白质的结构和功能。