蛋白质从头设计
互联网
5484
蛋白质从头设计
成功地从头设计一个蛋白质或活性位点必须正确理解所有相关问题,尤其是理论及设计相当关键。由于设计的蛋白质是由一个算法(algorithm)、采用一组描述相互作用的参数而产生,因此在设计参数和蛋白质特性之间可以建立直接的实验联系。
(一)设计策略
设计的一般策略是“设计循环”(designcycle),就是理论设计和实验验证交互进行,逐步发展。首先由一个算法,基于某些理论和研究结果,设计出初始分子模型;然后实际构建这个分子,用各种手段分析,寻找成功或失败或不理想的原因;接着修改算法、参数、理论基础,改进模型,进行重新设计,如此循环反复。
在这个过程中,复杂程度渐进提高,对蛋白质结构和功能的理解也逐渐深刻丰富起来。
(二)须考虑的相关因素
具体设计中要考虑的因素较多,例如要正确选择二级结构倾向性的残基,正确布置适应目标结构的“二元模式"(binarypattern)。正确选择转角、帽结构以连接和终止螺旋,正确选择适应于堆积核心的疏水侧链。另外,还可以导人内部的极性作用,主要有二元模式、二级结构倾向性、互补堆积(complementarypacking)等。
所谓二元模式指的是氨基酸的亲疏水性在编码结构中的作用。对残基的亲疏水性的考虑几乎是设计中的唯一标准,是最重要的因素。天然蛋白质折叠时,总是尽可能将疏水残基埋进内部,而将亲水残基暴露在表面。
二元模式的作用可能主要在二级结构上发挥出来,二级结构具有周期性,沿主链残基的亲疏水性也是有周期性的,并与二级结构相适应。
对已知结构数据库的统计分析表明,各种氨基酸在不同的二级结构中出现的频率是不同的,就是说各种氨基酸形成不同二级结构的倾向性是不同的,这就是所谓的二级结构倾向性。设计时应将合适的氨基酸安排在其倾向的二级结构中,特定的序列还可以成为某种二级结构的起始或终止信号。
设计中还要考虑到“互补堆积”,即天然蛋白质核心中的侧链相互镶嵌地堆积在一起,几乎不留出什么空间。这种作用可使疏水作用尽量得大,又不至于引起拥挤。所以,对侧链的大小外形都是有一定要求的。
尽管大多数极性侧链都是暴露在表面,而内部还有一些极性侧链构成盐桥或氢键网络。这些内部的盐桥或氢键网络并不能使蛋白质稳定,而是建立了一种构象特异性。对已知结构数据库的统计分析发现,内部的极性残基比在表面的极性残基要保守得多,不少成功的设计工作都是内部引入了有限的几个极性残基。
成功的设计须仔细地考虑各种因素,但是目前人们对蛋白质结构并没有完全理解,每一条经验规律都存在着许多例外情况,所以有人也认为过细的考虑纯属多余。
(三)设计方法
目前所有的算法都基于一种思路,首先选择某种主链骨架作为目标结构,随后固定骨架,寻找能够折叠成这种结构的氨基酸组合。这就是目前蛋白质从头设计具体步骤的主要两步,即所谓的“逆折叠”(inversefolding)方法。寻找目标组合的直接想法是穷举法,检查合适大小范围内的每种组合,选出正确的组合。
但实际上,即使设计一个小肽,穷举法也几乎是不可能的。一条特定的肽链所能采取的构象的数目是极其巨大的。以相对较小的100个残基的肽链为例,由20个天然氨基酸组成,就有20100(大于10130)种可能性。
如果每种可能合成一个分子,把这些分子放到一个盒子里,这个盒子会比数个宇宙还大!更何况每个残基位置上都可能有许多转子,这个组合数就太大了。解决的办法是先考虑“二元模式”和氨基酸的二级结构倾向性,各个位置上不是每个氨基酸都适合的,考虑到这些特性后,每个位置上就只有不多的氨基酸须进一步检验了。