蛋白质三级结构的预测软件
互联网
由于用X光晶体衍射和NMR核磁共振技术测定蛋白质的三维结构,以及用生化方法研究蛋白质的功能效率不高,无法适应蛋白质序列数量飞速增长的需要,因此近几十年来许多科学家致力于研究用理论计算的方法预测蛋白质的三维结构和功能,经过多年努力取得了一定的成果。
蛋白质三维结构的预测方法通常包括:同源性建模和从头开始的预测方法。对数据库中已知结构的序列的比对是预测未知序列三级结构的主要方法,也即同源建模的方法。
在进行序列比对时,最容易使用BLASTP程序比对NRL-3D或SCOP数据库中的序列。如果发现超过100个碱基长度且有远高于40%序列相同率的匹配序列,则未知序列蛋白与该匹配序列蛋白将有非常相似的结构。在这种情况下,同源性建模在预测该未知蛋白精细结构方面会有非常大的作用。同源性建模的成功的关键通常不是建模使用的软件或服务器,在设计与模版结构好的比对时的技巧更加重要。
自动蛋白质同源模建服务器,有两个工作模式:第一步模式(FirstApproachmode)和优化模式(Optimisemode)。程序先把提交的序列在ExPdb晶体图像数据库中搜索相似性足够高的同源序列,建立最初的原子模型,再对这个模型进行优化产生预测的结构模型。
利用神经网络进行同源模建预测蛋白质结构的方法。
DALI:DALI算法在两个蛋白之间寻找相似的接触模式,并进行优化后返回最佳的结构比对方案。这种方法允许任意长度的空隙,并允许比对片段间互相交替连接,这样就帮助了在整体上不相似的不同蛋白之间寻找相似的特定结构域。DALI的Web界面能对PDB中已有的两组坐标进行分析,也可由用户提交一组PDB格式的坐标。其中,若两个目标蛋白都在PDB库中,则可以在一个“全对全”的PDB比较数据库FSSP蛋白折叠类家族结构比对库中找到已经算好的结构近邻。
TOPITS:在TOPITS方法中,PDB库里的蛋白质三维结构被翻译成二级结构的一维“字符串”,构成搜索的数据库。然后,查询序列的二级结构和溶液可及性通过PHD方法被确定,结果也存成一维字符串。查询和目标字符串再以动态规划方法进行比对,并以此作出结构预测。返回的结果是分级列表,给出查询序列与目标结构的最优比对,以及对预测准确性概率的评估。
从头开始预测:构建H-P模型。详见蛋白质三级结构预测中的“从头预测方法”,此处不再重复。