蛋白质三级机构预测方法的分析与评价
互联网
对各种方法所得到的蛋白质结构预测结果需要进行验证,以确定预测方法是否可行,确定其适应面。验证的一种方法是取已知结构的蛋白质,对这些蛋白质进行模拟结构预测,并将预测结构与真实结构进行比较,分析两者之间的差距。
为了客观地评价各种预测方法,需要建立权威的评判机构,建立公共认可的蛋白质结构测试数据集。设立在马里兰生物技术研究中心的CASP就是这样一个系统。
对蛋白质结构预测的同源模型化方法、线索化方法和从头预测方法实验测试和评价,结果表明:
(1)在同源模型化方法中,得到一个好的序列比对是该方法的关键。当目标蛋白质与模板等同部分超过60%时,完全可以找到正确的比对。然而如果序列相似程度只有20-25%,则很难找到正确的比对。如果相似程度低于20%,则同源模型化方法几乎无能为力,因为在这种情况下,很难或无法找到合适的模板。
(2)对于线索化方法,如果能够找到同一家族远程同源蛋白质,则可以获得比较好的预测结果。如果找到的模板属于不同的家族,则预测准确性难以保证。
(3)对于从头预测方法,还难以产生准确的预测结构。
在三维结构预测方面,目前有待深入研究预测方法。根据同源性所得到的结构模型一般精度达到原子分辨率,对于SWISS-PROT数据库中的序列,大约三分之一能够得到粗糙的结构模型。不幸的是,许多模型在环区的位置标定方面存在着较大的误差。
线索化技术通过搜索远程同源蛋白质能够大大地提高这个比例,但是对于大规模的序列分析,线索化技术还仍然不是太可靠。对于一个未知结构的蛋白质,若没有其同源蛋白质的结构,则该蛋白质结构信息的唯一来源就是实验,或者通过从头算方法进行结构预测。
即使在不远的将来我们会通过实验得到更多的蛋白质结构,但有一类蛋白质仍然对实验测定方法提出挑战,这就是膜蛋白。
其中最大的障碍是这类蛋白质不能结晶,并且即使用核磁共振NMR技术也难以测定其结构。因此,对于这类蛋白质,结构预测方法就显得格外重要。