--蛋白质结构预测进展--
丁香园论坛
1076
蛋白质结构预测
1蛋白质结构预测的方法
蛋白质结构预测的目的是利用已知的一级序列来构建出蛋白质的立体结构模型,对蛋白质进行结构预测需要具体问题具体分析,在不同的已知条件下对于不同的蛋白质采取不同的策略,目前预测蛋白质空间结构的方法可以分为两大类:
2.1.1分子动力学方法
这类方法采用分子力学、分子动力学的方法,根据物理化学的基本原理,从理论上计算蛋白质分子的空间结构,这类理论计算方法依据一个基本热力学假定:一个蛋白质分子的溶液中的天然构象相应于热力学上最稳定、自由能最低的构象,但这一方法目前存在着三个主要问题,首先,用以描述蛋白质一溶剂系统工程力场和能量函数还和于半定量阶段;其次,数学上还没有有效方法解决能量极小化问题;第三,目前并没有证据证明蛋白质的天然构象就是全局自由能最小的构象。
2.1.2基于知识的预测方法
这类方法通过对已知空间结构的蛋白质进行研究和分析,找出蛋白质一级结构和空间之间的联系,总结出一定的规律并建立一些经验规则。这类方法已经被成功地应用于同源蛋白质空间结构预测的研究。然而对于同源性低的和非同源蛋白质分子来说,由于受二级结构预测精度的限制,这种方法只取得了非常有限的成功。
通过对大量已知空间结构的蛋白质分子的研究和分析,发现一条多肽链可能采取的构象的数目是相当大的,但在蛋白质分子中由二级结构预测是解决从蛋白质的一级结构预测其空间结构这一问题的关键步骤,现有的预测方法都假定蛋白质的二级结构主要由邻近残基因的短程相互作用所决定的,然后通过对一些已知空间结构的蛋白质分子进行分析、归纳,制定出一套预测规则并根据这些规则对其他已知或未知结构的蛋白质分子的二级结构进行预测,目前常用的方法有:基于单残基统计的Chou-Fasman 方法,基于信息论和统计的Garnier方法,Lim方法,人工神经网络方法等。据一些检验结果,上述几种方法的预测率分别为50%、56%、59%和64%,而现在一般认为二级结构的预测准确率如果达到80%的话,我们就可以基本准确地预测一个蛋白质分子的三维空间结构,因此进一步提高蛋白质二级结构预测的精度是当务之急。
2.2 蛋白质二级结构预测新进展
由于蛋白质二级结构预测方法中第一类方法在数学上遇到难以解决的多重极小值问题,而第二类方法又受到预测精度的限制,近年来一些科学家提出了一种预测蛋白质三维结构的新策略,这类方法被称为Threading方法或折叠类型识别方法,这一方法的基本思想是假定被预测蛋白质的折叠类型与某一已知结构的蛋白质的折叠类型相同,这样,蛋白质结构预测的问题就转变为在已知空间结构的蛋白质中,选取一种被预测序列最可能采取的折叠类型,从而大大减少了预测蛋白质结构的难度,这一方法已经成功地预测了一些蛋白质的空间结构。除了Threading方法外,近年来,国际上一些研究组还发展了一些从蛋白质的一级结构直接预测蛋白质空间结构的新方法。这些方法的基本思想是将基于知识的方法与计算化学以及统计物理学的方法相结合,采用简化的蛋白质模型和根据已知结构的蛋白质所导出的平均势场,从理论上计算蛋白质的空间结构。这些方法不仅可以从蛋白质的一级结构直接预测蛋白质的三维结构,而且可以在计算机上模拟蛋白质分子折叠的全过程。目前,还有一些新方法如遗传算法、模拟退火、**统计、模糊集合论方法等在蛋白质结构预测中的应用也正在研究中。通过对一些简单蛋白质分子的模拟研究,这些新方法已经显示出很强有力的生命力,许多权威人士推测,随着这些新方法的进一步改进和完善,在今后10年内,蛋白质折叠这一分子生物学中的难题将有望得到解决。
蛋白质分子模拟软件
随着分子模拟技术的飞速发展,逐步形成了一些商品化的软件。应用于生物大分子领域的商品化分子模拟软件的主要有美国MSI公司的Insight II软件和Quanta软件,以及Tripos公司的Sybyl软件;在国内,北京大学物理化学研究所也开发了一套“北京大学蛋白质分子设计系统”。这些商品化软件在不断的变化和发展中,有些软件模块,每年都更新版本,不断完善这些软件的功能。
1蛋白质结构预测的方法
蛋白质结构预测的目的是利用已知的一级序列来构建出蛋白质的立体结构模型,对蛋白质进行结构预测需要具体问题具体分析,在不同的已知条件下对于不同的蛋白质采取不同的策略,目前预测蛋白质空间结构的方法可以分为两大类:
2.1.1分子动力学方法
这类方法采用分子力学、分子动力学的方法,根据物理化学的基本原理,从理论上计算蛋白质分子的空间结构,这类理论计算方法依据一个基本热力学假定:一个蛋白质分子的溶液中的天然构象相应于热力学上最稳定、自由能最低的构象,但这一方法目前存在着三个主要问题,首先,用以描述蛋白质一溶剂系统工程力场和能量函数还和于半定量阶段;其次,数学上还没有有效方法解决能量极小化问题;第三,目前并没有证据证明蛋白质的天然构象就是全局自由能最小的构象。
2.1.2基于知识的预测方法
这类方法通过对已知空间结构的蛋白质进行研究和分析,找出蛋白质一级结构和空间之间的联系,总结出一定的规律并建立一些经验规则。这类方法已经被成功地应用于同源蛋白质空间结构预测的研究。然而对于同源性低的和非同源蛋白质分子来说,由于受二级结构预测精度的限制,这种方法只取得了非常有限的成功。
通过对大量已知空间结构的蛋白质分子的研究和分析,发现一条多肽链可能采取的构象的数目是相当大的,但在蛋白质分子中由二级结构预测是解决从蛋白质的一级结构预测其空间结构这一问题的关键步骤,现有的预测方法都假定蛋白质的二级结构主要由邻近残基因的短程相互作用所决定的,然后通过对一些已知空间结构的蛋白质分子进行分析、归纳,制定出一套预测规则并根据这些规则对其他已知或未知结构的蛋白质分子的二级结构进行预测,目前常用的方法有:基于单残基统计的Chou-Fasman 方法,基于信息论和统计的Garnier方法,Lim方法,人工神经网络方法等。据一些检验结果,上述几种方法的预测率分别为50%、56%、59%和64%,而现在一般认为二级结构的预测准确率如果达到80%的话,我们就可以基本准确地预测一个蛋白质分子的三维空间结构,因此进一步提高蛋白质二级结构预测的精度是当务之急。
2.2 蛋白质二级结构预测新进展
由于蛋白质二级结构预测方法中第一类方法在数学上遇到难以解决的多重极小值问题,而第二类方法又受到预测精度的限制,近年来一些科学家提出了一种预测蛋白质三维结构的新策略,这类方法被称为Threading方法或折叠类型识别方法,这一方法的基本思想是假定被预测蛋白质的折叠类型与某一已知结构的蛋白质的折叠类型相同,这样,蛋白质结构预测的问题就转变为在已知空间结构的蛋白质中,选取一种被预测序列最可能采取的折叠类型,从而大大减少了预测蛋白质结构的难度,这一方法已经成功地预测了一些蛋白质的空间结构。除了Threading方法外,近年来,国际上一些研究组还发展了一些从蛋白质的一级结构直接预测蛋白质空间结构的新方法。这些方法的基本思想是将基于知识的方法与计算化学以及统计物理学的方法相结合,采用简化的蛋白质模型和根据已知结构的蛋白质所导出的平均势场,从理论上计算蛋白质的空间结构。这些方法不仅可以从蛋白质的一级结构直接预测蛋白质的三维结构,而且可以在计算机上模拟蛋白质分子折叠的全过程。目前,还有一些新方法如遗传算法、模拟退火、**统计、模糊集合论方法等在蛋白质结构预测中的应用也正在研究中。通过对一些简单蛋白质分子的模拟研究,这些新方法已经显示出很强有力的生命力,许多权威人士推测,随着这些新方法的进一步改进和完善,在今后10年内,蛋白质折叠这一分子生物学中的难题将有望得到解决。
蛋白质分子模拟软件
随着分子模拟技术的飞速发展,逐步形成了一些商品化的软件。应用于生物大分子领域的商品化分子模拟软件的主要有美国MSI公司的Insight II软件和Quanta软件,以及Tripos公司的Sybyl软件;在国内,北京大学物理化学研究所也开发了一套“北京大学蛋白质分子设计系统”。这些商品化软件在不断的变化和发展中,有些软件模块,每年都更新版本,不断完善这些软件的功能。