比较建模法预测蛋白质的结构
互联网
3060
比较建模法预测蛋白质的结构
比较建模法(comparative modeling method)是基于知识的蛋白质结构预测方法,又称为同源结构预测,是根据大量已知的蛋白质
三维结构来预测序列已知而结构未知的蛋白质结构。
按照目前的定义,若待模型构建蛋白质的序列与模板序列经比对(alignment)后的序列同源性(sequence identity)在40%(也有人认为在35%)以上,则它们的结构可能属于同一家族,它们是同源蛋白(homology)可以用同源蛋白模型构建的方法预测其三维结构。因为它们可能是由同一种蛋白质分化而来,具有相似的空间结构及相同或相近的功能。因此,若知道了同源蛋白家族中某些蛋白质的结构,就可以预测其他一些序列已知而结构未知的同源蛋白的结构,可以用同源模型构建的方法预测未知蛋白质的三维结构。同源蛋白模型构建的步骤如下。
(一)目标蛋白序列与目标序列的匹配
应用FASTA或BLAST搜索软件,在PIR、SWISSPROT或GENEBANK等序列库中按序列同源性挑选出一些同源性比较高的序列,然后把挑选出的序列与目标序列基序多重匹配,得到模板结构等价位点套的初始集合。
(二)根据模板结构构建目标蛋白结构模型
在已确定的模板结构等价位点套的初始集合的基础上,旋转每一个模板的结构,使它们相互间的未知尽可能多地重叠在一起。不同两个模板在空间中若复合一定的重叠距离标准,那它们相互之间的关系就是等价位点。许多这样的等价位点构成了等价位点套。
叠合结束后,即得到了同源蛋白的结构保守区(SCR),以及相应的基架结构(framework)。模板结构匹配后,一般还要用得到的同源体的SCR的第一条序列与目标序列匹配,挑选出目标序列上的高相似区,定义为目标蛋白的SCR。Homology、UQANTA/CHARM、COMPOSER、CONSENSUS、MODELLER和Collarextension等软件和方法可以用于目标蛋白结构模型的构建。
(三)对模型构建结构基序的优化和评估
同源结构模型构建(预测)得到的蛋白质结构模型,通常含有一些不合理的原子间接触,须对模型进行分子力学和分子动力学优化,消除模型中不合理的接触。另外,模型中有些键长、键角和两面角也有可能不合理,也须检查评估。PROCHECK和PROSAⅡ等软件常用于完成这类工作。