材料与仪器
步骤
本节讨论盘绕螺旋特异性设计所涉及的几个不同方面。我们的目标是在核心处和边沿位置选择氨基酸以得到期望的寡聚态( 见 3. 2.1)、特异性(见 3. 2. 2 ) 和螺旋取向 ( 见 3.2.3 )。这里,我们也把针对特定稳定性的不同设计方案联系起来。第 4 小节(见 3. 2.4 ) 涉及整体稳定性,集中在外部位点(b、c 和 f )。本章我们把所有内容分为小节逐一讨论。但是,正是由于所讨论的导致盘绕螺旋形成的相互影响的各因子的本性,本节的讨论会在几个地方互相交叉。因此,对于处理同一残基位置所起的不同作用的小节可以被认为是互相联系的片段。
3. 2. 1 寡聚态
为正常地发挥功能,任何蛋白质都必须折叠成合适的三维结构。类似地,盘绕螺旋结构必须采取正确的寡聚( 四级)结构。在下一小节,讨论实现正确结构的主要因素。
3.2.1.1 核心残基
图 3.1,我们称 a 和 d 残基为核心残基,因为它们绕着每一个螺旋形成疏水带。 a 和 d 重复残基的非极性本性,有利于沿着每一螺旋的一面发生寡聚。这与在球蛋白折叠时蜷缩成的疏水核心类似,并代表对盘绕螺旋整体稳定性的主要贡献。结果是,核心残基在定义寡聚态上发挥主要的作用。
位置 a 和 d 上的疏水侧链,以 “杵适配臼”(knob- into - hole) 的方式掩埋于相邻螺旋中,并最先由 Crick 在 1953 年所描述 [ 15 ] 。在这一模型中,一个 a 螺旋的一个侧链 ( 杵),插入对面的 a 螺旋上的 4 个侧链围成的空间(臼)中,反之亦然。堆积几何被 Cα—Cβ 键与臼底部的 Cα—Ca 向量构成的角在螺旋底部的投影所定义。对平行二聚体而言,位置 a ( 七元重复位置 i ) 的杵,适配到另一个螺旋的由位置上的残基顺时针排列(如果对着空洞看去)而成的臼中。因而,di 位的杵是在 a'i、d'i、e'i 和 a'i+1 围成的臼中(图 3.1)。
对 GCN4 ( Jun 转录因子的酵母同源物,有时称为 GCN4-p1,见注 1 ) 盘绕螺旋不同核心突变的全面而完整的分析,揭示了不同寡聚态的不同堆积几何(表 3.1;参考文献 [ 16 ])。GCN4-p1 二聚体 X 射线结构中的侧链堆积,和一个设计的四聚 GCN4 突变体的比较,证明 a 层和 d 层的局部几何被翻转了。平行的杵适配白堆积在二聚体的 3 层和四聚体的 d 层。相反,垂直的杵适配臼堆积,在二聚体的 d 层和四聚体的 a 层。在平行的三聚变体中,在 a 和 d 位发现了第三类的杵适配臼堆积 [17],在这两层中,每个杵的 Cα—Cβ 键与在对应臼底部的 Cα—Cβ 键成近似的 60° 角。这一安排称为“尖锐” 的杵适配臼堆积。
这些不同的几何关系,解释了一定的寡聚态有独特的氨基酸偏好。下面列出几个实验结果,这些实验测试不同氨基酸对稳定性和寡聚特异性的影响。
( 1 ) 特异的疏水残基在强制盘绕螺旋采用何种寡聚态上是关键的。Harbmy 等系统地把 GCN4 ( 除 a1Met 外)所有的 a 和 b 残基改变为 Leu、Val 或 lie ( 见注2 ; 参考文献 [16])。如表 3.1 所示,这使得盘绕螺旋采用不同的寡聚态。GCN4- IL ( IL 指 a 位的 lie 和 d 位的 Leu)、II 和 LI 突变体分别是二聚、三聚和四聚,并且在研究的整个浓度范围内(寡聚态)与浓度无关。VI、VL、LV 和 LL 突变体以多种方式寡聚。 L、V 和 I 的每一个组合给出独特的堆积偏好,因而形成独特的几何特征。
a. 带 β 分支的残基(Val 和 lie ) 适合于平行的杵适配臼堆积(二聚体的 a 层和四聚体的 d 层),而 γ 分支的残基 Leu 适合于垂直的(二聚体的 d 层和四聚体的 a 层)几何特性。相反, β 分支的氨基酸插入垂直位,需采用热力学不利的旋转构象态 [18] 。
b. 很有可能,lie 和 Val 虽有相似的立体化学,但在建立寡聚态上是不等价的。在 a 位 的 Val 导致二聚体的能力比 lie 弱。与 Val 导致二聚-三聚混合物相反,lie 给出较高的二聚特异相互作用。
c. 与二聚体和四聚体结构相反,三聚体内部的堆积,在两个疏水位点,可以适应具有最适旋转构象态的 β 分支残基。
( 2 ) 在 Woolfson 和 Alber 的研究中,包括了对核心残基作用的研究,并把这些作用用来衡量七元重复残基的二聚和三聚倾向 [19] 。分析二聚体和三聚体的特性,并用这些特性来鉴别新的序列。掩埋的 Leu、lie、Asn、Lys 和 Gin 在其预测算法中是关键的,称之为 COILER。总的来说,使用了 21 个已知形成二聚体和三聚体的不同的蛋白质,相当于数据库中的 721 个七元重复。
a. 在起先考虑的 7 种氨基酸中(Ala、Phe、lie、Leu、Met、Val ) ,只有 a 位的 lie 和 Leu 以及 d 位的 Leu 在统计意义上被观察到。二聚体偏好 a 位富集 lie 和 d 位富集 Leu,而二聚体中的 d 位几乎没有 lie。很清楚,在这些位置上对氨基酸的这些选择使二聚体的形成有最好的堆积几何 [ 见 3.2.1.1 中(1 ) 和 表 3.1]。
b. 在盘绕螺旋序列的核心部位,Val 比 lie 分布得更均匀。在二聚体和四聚体的 a 位 和 d 位,Val 出现的频度甚至低于随机分布的预期值。这些结果与观察到的下述事实相符:a 位和 b 位的 Val 很难区分盘绕螺旋的二聚态和三聚态 [ 第 3.2.1.1 中(1 ) 和表 3.1]。
c. 三聚体中 a 位 和 d 位的堆积是差不多的,这些位置对氨基酸少有特异性,使得疏水氨基酸的分布更均匀 [ 16,19] 。
( 3 ) 在研究设计好的反平行盘绕螺旋核心位置的丙氨酸的位置效应时(见注 3 ),Monera 等发现,当丙氨酸残基在适当位置(即在同一个环上)时,会形成二聚体 [ 20 ] 。如果丙氨酸残基不同步,会形成四聚体。对此,最可能的解释是,四聚体中同步丙氨酸形成的孔穴高度地不稳定,因而倾向于形成二聚体,而 Leu-Ala 重复使孔穴分布在较大范围内,从而减少在疏水掩埋和范德华相互作用上的损失。这证明了寡聚特异性是核心残基堆积引起的。
( 4 ) 软骨寡聚基质蛋白质(COMP ) ,属于血小板反应素家族,包含 5 链的非常稳定的平行 α 螺旋盘绕结构。46 个氨基酸长的盘绕螺旋区域(见注 4 ) 包含环分子间(即螺旋与螺旋间)的半胱氨酸二硫键 [21]。五聚界面展示出杵适配臼堆积。a 位、d 位、e 位和 g 位残基构成若干杵,它们堆积入相邻亚单位的 a'-g' 位、d'-e' 位、c'-d'位和 a'- b' 位侧链围成的臼中。只有 f 位残基是完全暴露的,而其他 6 个位置的残基是明显被掩埋的。GCN4-pLI 突变体 [ 见 3.2.1.1 中(1 ) ] 和五聚的 COMP 结构都含有一个大的轴向孔洞。在四聚体中的隧道大小为 1.0~1.3 A [16],并因此而排除了水分子(半径 1.4A)。相反,沿着五聚体的小孔有几个小分子,这与其隧道的半径较大(2~6A)一致。
( 5 ) 把 d 残基改变为性质上更疏水的非天然氨基酸(三氟亮氨酸和六氟亮氨酸)的实验显示稳定性增加(见注 5;参考文献 [ 22 ] 和 [ 23 ])。
( 6 ) 用单甲基、双甲基和三甲基化的二氨基丙酸(dap) 类似物研究了 a/d 界面上的疏水掩埋,结果显示疏水性增加 [22] 。甲基加入一个单体的第 16 位(在类肽的第 16 位用天冬氨酸)时,使随后得到的杂二聚 GCN4-p1 ( 见注 6 ) 更稳定,可能是由于折叠状态的范德华相互作用得到增加和降低了折叠的溶解损失。但是 3 个甲基的加入降低了稳定性,可能是由于增加了立体化学的位阻。奇怪的是,2 个甲基加入合成的 dap 后,引起了齐三聚( 相同蛋白质或多肽的结合称为齐聚或同聚——译者注)。这证明了即使是小的尺度和疏水性的变化也能够改变稳定性与折叠倾向。
简而言之,在二聚的盘绕螺旋中,核心位置氨基酸的最好选择可能是 d 位 Leu、a 位 ( β 分支的 lie ( 或 Val)。如果使用了 Val,Asn ( 如同在天然盘绕螺旋中普遍见到的)就应该相应地放在中心 a 位,以增加相互作用的特异性(见 3.2.1.2 )。三聚体的最好设计是核心位都用 lie,而四聚体最好在 a 位用 Leu,d 位用 lie。对这种 β/y 侧链分支 ( 残基)安排的偏离,会导致不利的旋转异构能,降低所期望的结构稳定性,并可能产生盘绕螺旋的多种寡聚态和反平行结合态的混合,也就是使得特异性降低。
3.2.1.2 极性核心残基
与核心残基整体上疏水相反,大约 20% 的核心残基是带电的 [ 25 ] 。这些带电残基通常起到使结构形成正确寡聚态的作用,大概是通过保证螺旋在结构中按需要的方式排布,否则结构将以二聚、三聚和(或)四聚,以及平行和反平行混合物的形式存在。但是,通常在特异性上的所得,总伴随着稳定性的降低。以下列出这些残基在特异性和稳定性上的作用。
( 1 ) 在关于二聚体和三聚体的统计分析中 [ 见 3.2.1.1( 2 ) ] ,Woolfson 和 Alber 观察到:
a. 二聚体中 Lys 和 Asn 偏向于在 a 位,而三聚体中则基本没有。在二聚体的 a 位找到 Asn 的可能性比在三聚体中大 3 倍。
b. 三聚体的 a 位富含 Gln,Ser 和 Thr 则富集在 a 位或 d 位。
c. 常常与侧面 e 位和 g 位上的谷氨酸一起,在 a 位找到掩埋的赖氨酸。例如,这可以在 Jun/Fos 杂二聚体 [26] 以及 GCN4 Asn6Lys 突变体的 X 射线结构中找到 [ 见 3.2.1.2 ( 5 );参考文献 [27] ]。
( 2 ) 掩埋的 Asn 对(在处于合适的位置时),可能通过两个螺旋的两个 Asn 侧链之间生成的氢键,给二聚体以特异性,这一现象确实在 X 射线 [6] 和核磁共振 [28] 研究中被观察到。不满足 Asn 侧链的氢键位能的其他构象因而在能量上是不利的。
( 3 ) 如果 GCN4 -p1 核心 a 位的 Asn ( 见注 2 ) 被替换为 Val,以二聚化的特异性为代价,盘绕螺旋的稳定性大量增加。因为与 lie a 位的 Val 使得特异性缺失,Harbury 等报道得到了二聚体和三聚体的混合物 [ 见3.2.1.1 ( 1 ) 和表 3.1;参考文献 [16] ];同时,Potekhin 等报道了三聚体生成 [29] 。
( 4 ) 在另一个例子中,平行杂聚肽(见注 1 ) 的核心 Asn 对突变为 Leu 对(产生 Acid- pLL 和 Base-pLL 多肽),得到平行和反平行四聚体混合物 [ 30 ]。
( 5 ) 在 GCN4 的情形(见注 2 ),Alber 组把核心 a 位的 Asn 对改变为 Gln 和 Lys,以研究这是否也能得到寡聚特异性。Lys 产生的二聚体与野生型相似,而 Gln 产生二聚体和三聚体的混合物 [27]。他们推论为,极性基团制约的结构唯一性,不只是由极性掩埋引起的,也依赖于侧链与环境的正确相互作用。这些与上下文有关的效应,比起仅只是给定的七元重复位置的残基频度来,预测困难要大得多。
( 6 ) 当用一个蛋白质片段的互补试剂(见 3. 2. 5. 3 ) 二氢叶酸还原酶选择杂二聚的盘绕螺旋时,Arndt 等发现,在一个是 Val-Leu 的核心处,相比于 Asn-Val 或 Val-Val 组合 Asn 对构成的核心更受青睐(见注 7;参考文献 [31])。这与许多天然的盘绕螺旋相符合。
( 7 ) 在另一个研究中,二聚的 GCN4-pVL [ 见 3.2.1.1 ( 1 ) ] 的 a 位或 d 位被分别突变为极性残基 Asn、Gln、Ser 或 Thr ( 见注 8;参考文献 [25])。只有 a 位的 Asn 残基对和 d 位的 Thr 残基对能导致正确的寡聚态。可能是掩埋这些残基在核心中所损失的溶解能,被它们间的相互作用能所弥补,因而也能保证正确的螺旋安排。
( 8 ) 堆积环境的差别使疏水残基有不同的倾向性,即使是在 a 位和 d 位。在两个应用 a 位为 Val、d 位为 Leu 的模型多肽的透彻研究中,中心的 a 位和 d 位被系统地改变为每一种氨基酸,以测试它们在稳定性和寡聚态上的作用(见注 9;参考文献 [ 32 ] 和 [ 33 ])。这些改变,是有关疏水核心侧链替换对双链盘绕螺旋稳定性影响的第一个透彻的定量评估,并使得为 a 位和 d 位 19 种天然氨基酸建立热力学相对稳定性标度成为可能。表 3.2 列出了那些如果放在 a 位或 d 位会导致明确的寡聚态的氨基酸 [32]。A 位的 Leu-、Tyr-、Gin- 和 His- 取代类似物无一例外地是三链的,而 Asn-、Lyt、Om-、Arg- 和 Trp- 取代类似物无一例外地形成两链单体。在中心 d 位替换的时候,lie 和 Val ( β 分支残基)导致三链寡聚态 [ 见 3.2.1.1(1) ],而 Tyr、Arg、Lys、Orn、Glu 和 Asp 产生双链态。
( 9 ) Ji 等突变了 gp41—— 来自猿猴免疫缺陷病毒的 6 螺旋束包膜蛋白,与 gp120 一起,负责病毒与 CD4+ 细胞的融合 [ 34 ] 。在结构上,它是由反平行杂二聚体组成的三聚体蛋白。在这一研究中,为核心氢键和盐桥负责的(两个 Gln 和两个 Thr 残基)4 个被掩埋的极性残基的每一个,都单独地突变为 lie。其中,3 个形成更稳定的 6 螺旋束,另 1 个形成不溶的聚集体(见注 10)。这些结果证明了这些残基具有控制结构稳定性和特异性间平衡的能力。这是非常重要的,因为在融合之前,此蛋白质要经受结构变化,并必须在两个结构之间有正确的稳定平衡,以使得这种变化是可能的。这些极性核心残基协助调控此构象稳定性,因而,也协助膜融合本身。
一般来说,核心 a 位的 Asn 残基对显然在二聚体中占支配地位,特别是,如果核心偏离最优的 Ile-Leu a-d 残基布置的时候,因为这一组合似乎导致平行二聚,而不需要核心内的 Asn 对。核心的 a 位 Gln 对三聚体可能是好的选择,尽管为了确保三聚体排它的特异性,可能还需要其他一些因素。
3.2.1.3 边沿残基
七元重复的 e 位和 g 位(边)在盘绕螺旋界面上从侧面围着 a 残基和 d 残基(图 3.1)。这些位置的掩埋,高度地取决于寡聚态。结果,在 e 位和 g 位氨基酸的选取可能受到寡聚态的影响。表 3.3 显示掩埋面积的百分数,表示在螺旋单独存在时的侧链可及表面积在寡聚态中变成掩埋状的分数 [16] 。
( 1 ) 与二聚体中对应位置相比较,三聚体的 e 位和 g 位富含疏水残基(lie、Leu、Val、Phe、Tyr 和 Trp ) 并几乎没有特异的亲水残基(Glu、Gln、Ser 和 Arg;参考文献 [ 19 ] )。这些模式是与三聚体中疏水界面相对于二聚体的扩张相符的。疏水残基百分数的增加使狭窄的疏水面的宽度增加,并且高寡聚态的似然率也增加了。在高寡聚态中有比两螺旋的盘绕螺旋更多的非极性掩埋。这可以从表 3.3 中看出。在 e 位和 g 位的疏水掩埋百分比,大约增加了 40%。三聚体中在对面带电的 gi 到 e'i+1 残基对(12% ) 相对于二聚体(23% ) 的减少与此相符 [19] 。
( 2 ) Fairman 等突变了 lac 阻遏蛋白的 C 端同四聚盘绕螺旋结构域,以产生杂四聚盘绕螺旋 [ 35 ] 。在 e 位和 g 位周边的 b 位和 c 位,全为 Lys 或全为 Glu 的多肽,结合力很弱。但是,把它们混合起来,就会形成高度稳定的四聚体(见注 11)。这证明了,至少对于四聚体,b 和 c 残基在盘绕螺旋的稳定性上也起了重要作用。这种作用类似于二聚盘绕螺旋中存在的 g/e' 离子相互作用,但四聚体加宽了的疏水界面扩展到这些残基,离子作用从核心幵始向外后退到 b 和 c 残基。通过改变 pH 和盐的水平,Glu 和 Lys 间的这些离子对相互作用,被证明为对稳定性的增加负责。另外,这些电荷在齐性寡聚时直接相对,并且很可能在潜在的齐二聚相互作用体中,这一不利的电荷排斥推动了杂二聚体的形成 [ 9,35 ]。
3.2.2 配对特异性
本节讨论配对特异性的重要性,以及盘绕螺旋可以用来保证没有其他能量上有利的结构可以被接受的某些方法。引人注目的是,与序列和结构上的相似性相反,盘绕螺旋偏向于与功能上的伙伴相互作用。本节分析介导这种高特异性的因素。
3.2.2.1 核心残基
如 3.2.1.1 小节所述,疏水残基(主要是 Leu、lie 和 Val ) 分布模式是螺旋间结合的主要推动力。但是,因为这种模式非常常见,螺旋怎样能同时用其核心抗拒不同结构 的形成?答案是一个复杂的图像,包含微妙的变化,如非稳定化的、非疏水的核心残基的插入,这种变化会选择对抗另外种类的结构。
( 1 ) Sharma 等设计了一个多肽(anti- APCp1) ,其目的是用于结合来自腺瘤性结肠息肉(APC ) 的肠癌有关肿瘤抑制蛋白的盘绕螺旋序列(见注 12;参考文献 [36])。 这样,他们采用了核心改变以及结合 g/e' 相互作用,而不是 Asn 配对,以证实特异性可归因于这个相互作用。他们推理认为,考虑到核心残基在结合过程中的主导作用,以及核心突变对稳定性和特异性都有大的影响,发现在主导特异性上对核心残基的低要求是令人奇怪的。为了处理这个问题,他们设计了 1 个多肽,以结合到 APC 的头 55 个氨基酸(APC55 ) 上,并基于角蛋白的类型 I 和类型 II 杂二聚体在位置 a 和 d 的共变模式,突变了此 anti- APCp1,以产生更常见的 a-a' 和 d-d' 配对。他们做了 3 个突变(在 a 层的 A41 I、d 层的 A2M 和 M44A ),以把野生型的 Ala-Ala 和 Met-Met 相互作用分别变为更常见的 Ala-lie、Ala-Met 和 Met-Ala 相互作用。两个更进一步的突变(a 层的 T6G 和 d 层的 N30H ) 用对应的 Gly-Gly 和 His-His 对来降低齐二聚体的稳定性。在定向抗 anti-APCp1 齐二聚化的同时,额外的 e-g' 配对优化了离子相互作用,所得二聚体具有稳定性及特异性。
( 2 ) Schnarr 和 Kennan 通过核心疏水残基的立体化学配合形成了杂三聚蛋白 [37] 。 在他们的研究中,用各种不同侧链长度的非天然氨基酸来启动特异的杂三聚体形成。 研究者们把 GCN4 核心 a 位残基用 Ala 或环己基丙氨酸替代(见注 13),结果得到的是三聚体中立体化学不匹配的核心层,以 3 个 Ala 或 3 个环己基丙氨酸,产生立体规避或排斥。但是,2 个 Ala 和 1 个环己基丙氨酸产生了 1 个立体化学配合很好的杂三聚体。非天然侧链可以以这种方式产生盘绕螺旋。环己基丙氨酸的额外体积弥补了 Ala 核心层,以提供立体配合,而更大的侧链只会使分子不稳定。
3.2.2.2 极性核心残基
在 3.2.1.2 讨论了极性核心残基在引导螺旋特异的寡聚态上的作用。在 3.2.1.1 曾提到,在盘绕螺旋配对中的异型核心接触允许产生杂特异性。更多的特异性可通过极性核心与外沿残基的相互作用得到。
( 1 ) 在天然二聚盘绕螺旋中,a 位的 Lys 是仅次于 Asn 的最普通的掩埋极性残基 [19] 。A 位 Lys 可以与前 1 个七元重复的 e 位残基 [27] 形成螺旋内静电相互作用,以及与平行二聚体中,对面螺旋前 1 个七元重复的 g' 位的极性残基,形成螺旋间 g'-a 极性相互作用 [26]。
( 2 ) Campbell 和 Lumb 在肽拉链(PV) 的 Base-pLL 中放入了两个 a 位 Lys,以在肽拉链的 Acid-pLL 中实现螺旋间的由这 2 个 Lys 与 e' 和 g' 位的 Glu 残基提供的极性相互作用(见注 14;参考文献 [38])。正如所期待的,结果偏向于二聚态,很可能是因为在高寡聚态中会有较大的溶解损失。另外,这样的相互作用,相比于 Asn-Asn (a-a') 相互作用,对稳定性的损害较小,主要是因为后者有较大的溶解损失需要付出。然而,平行和反平行的皆有可能,主要是因为,平行取向中的 a-g' 相互作用和反平行取向中的相互作用在能量上是相似的。
( 3 ) Harbury 的组采用计算方法 [ 见 3.2.5.4 (4)],不仅考虑期望的结构,而且考虑不同的不期望的结构,以实现特异性 [39] 。改变了 GCN4 的中心七元重复的 a 位、d 位、e 位和 g 位残基(见注 15 );所有非脯氨酸残基以及同型和异型序列都经受了计算选择和实验验证。次于 g/e' 残基对的体积互补和电荷互补,发现 d 位的 Glu 宁愿与 e' 位的 Arg 配对。
3.2.2.3 边缘残基
配对特异性受到 e 位和 g 位残基静电本质的影响(在平行二聚螺旋中,一个七元重复的 g 位与另一个螺旋的下一个七元重复的 e' 位,被记为 i→i’+5 )。这些残基常常分别是 Glu 和 Lys。这样互补的残基对相互作用,分别增加并巩固原来由核心疏水作用提供的特异性和稳定性。盘绕螺旋外接触边缘的电荷模式会指导蛋白质是形成齐聚还是杂聚蛋白,以及盘绕螺旋内的取向是平行的还是反平行的。但是,PV 假定(见第 1 节;参考文献 [ 8 ] ) 过分地简单化;那些在复合物稳定性上很少有或没有作用的残基,通过指导螺旋避开,那些会危及分子的特异性的,同样的或不期望的相互作用来达到其目的(负设计)。另一方面,某些盘绕螺旋似乎没有经受到进化压力,因为它们已经是特异性的,并且也不需要比它们现在的状态更稳定。
( 1 ) 如所期待的,用排斥的 Glu-Gk 配对取代有利的 g/e' 位 Gin-Gin 配对已被证明使盘绕螺旋构象不稳定 [ 40]。
( 2 ) Hodges 及其同事估计 g/e' 配对盐桥对盘绕螺旋稳定性的贡献是 0.37 kcal/mol ( 见注 16;参考文献 [41])。
( 3 ) 细心 e 和 g 位电荷,可容许杂二聚体的生成,并另外保证,如 PV 假定所包含的,不倾向于生成齐二聚体[ 9,42,43] 。
( 4 ) 在 e 位和 g 位找到的 4 个最常见的氨基酸是 Glu、Gln、Arg 和 Lys。这些残基含有长疏水侧链,能够与 a 和 b 核心残基作用,并终止于一带电(Glu、Arg 或 Lys) 或极性(Gin) 基团。通过先突变 e,而后 g,最后两个七元重复对上的残基为 Ala,Krylov 等针对鸡的卵黄蛋白原结合蛋白成功地建立了这些相互接触残基的耦合能 ( 见注 17)。这一双突变热力学循环被用来为外沿残基接触的倾向建立热力学标度(表 3.4)。在 150 mmol 氯化钾和 pH 7.4 的条件下,Glu-Arg 吸引被证明比 Glu-Lys 吸引稍微稳定,合理的解释是,Arg 的侧链较长并较好地与谷氨酸相互作用,而且,各个甲基更有效地把核心与溶剂屏蔽开。这样的后果是增加带电末端基团的作用,在较弱的水性环境中产生较大的贡献。如所预期的,高盐像低 pH —样,弱化这些相互作用。在高盐或低 pH 条件下,极性作用减弱,疏水作用增强。Glu-Arg、Glu-Lys 和 Gin-Gin 相互作用是最具稳定能力的(与取向无关)。而 Glu-Glu、Arg-Arg、Arg-Lys、Lys-Arg 和 Lys-Lys 这些相同电荷的相互作用相当地不受欢迎。
( 5 ) Arndt 等设计了一个多肽库。此库的设计基于 Jim-Fos 杂二聚,库中 b、c 和 f 残基来自于各自的野生型蛋白,a 位和 d 位为 Val 和 Leu ( 带有 a3Asn 在核心的插入例外,此插入引导期望的螺旋取向和寡聚态),e 和 g 残基则用三核苷酸作改变以得到等摩尔的 Arg、Lys、Gin 和 Glu 混合物(见注 7;参考文献 [8])。出人预料的是,最好地选择出来的成功者-Winzip-A2B1 杂二聚体(见注 18),在 g/e' 位缺少完全互补的带电残基,尽管选择过程是很彻底的。更确切些说,6 个 g/e' 对的两个预测为排斥的,提示得到的序列偏离简单的电荷互补规则( PV 假设)。可以假定,整体静电势(包括分子内和分子间相互作用)起主要的作用,并且与核心残基的作用,如像有利的堆积或立体冲撞,也可以调节这些 g/e' 作用(见参考文献 [ 8 ] 和 [ 31 ] 及其中引用的文献 )。这样的观察与天然发生的盘绕螺旋相符,这些天然结构通常有复杂的相互作用模式。这些盘绕螺旋必须满足一些标准,如生物稳定性和在家族内的极高特异性,而与其他盘绕螺旋家族间没有交叉反应 [46]。
3.2.3 螺旋取向
盘绕螺旋多数折叠为平行排布,但是,越来越多的测定了结构的蛋白质含有反平行的盘绕螺旋结构域 [47] 。与反平行盘绕螺旋的生物学重要性逐渐得到承认相反,对这类分子的研究被没有行为规范的模型体系所牵制。例如,在像丝氨酰转移 RNA ( t RNA ) 合成酶或丁型肝炎抗原那样的蛋白质中发现的反平行盘绕螺旋,都被证明足以实现没有更进一步结合的二聚化。
Hodges 及其合作者第一个报道了全新设计的,被内部二硫键限定在反平行取向的盘绕螺旋的表征 [48] 。这一以及其他设计的反平行盘绕螺旋,分别比它们的有几乎等价的螺旋间相互作用的平行对应物更稳定 [49,50]。这些数据显示,假定其他一切都是等价的,螺旋偶极相互作用(见 3.2.4.3 ) 偏好反平行取向。
3.2.3.1 核心残基
在平行盘绕螺旋中,互相堆积的核心残基有 a-a' 和 d-d'。在反平行盘绕螺旋中有 a-d' 和 d-a' 中心堆积,产生同样的堆积层 [51]。
( 1 ) 已经证明,Ala 残基在全新设计的盘绕螺旋核心的相对位置可以控制平行或反平行取向 [ 见 3.2.1.1 ( 3 );参 考文献 [52] ] 。通过细心地放置 Ala 在中间的七元重复中,全平行的或全反平行的四聚体都可以形成。在分子中间核心位置的七元重复的中间两层平面用另一种不同的残基对 Ala 和 Leu (Ala- Leu- Ala- Leu) ,也可以达到同样目的。这样由大小两种残基交替组成的核心(Ala- Leu- Ala- Leu) 是引入小侧链的最好办法。在平行安排中,堆积会是在一个平面中都是 Ala,而另一个平面中都是 Leu,于是导致一个大空洞从而溶解核心并使分子不稳定( 见注 19)。
( 2 ) 在一个类似实验中,二聚的 GCN4-p1 ( 见注 2 ) 核心 Asn 被变为 Ala。结果是得到反平行三聚体,以避免核心空洞 [53] 。但是,在苯存在的条件下,得到的是平行三聚体,苯结合在核心空洞中。
( 3 ) 在最近称为 APH 的反平行同二聚盘绕螺旋的设计中,疏水核心中的 β 分支的立体匹配(lie 于 d 位)和截断的侧链(Ala 于对面的 a' 位)以及其他特性 [也见 3.2.3.3 (3)] —起被用来启动反平行取向。平行排布在 lie 的 d 层是能量上没有优势的,从而很差地被放在二聚盘绕螺旋中(见 3.2.1.1 ),和疏水核心的 Ala-Ala 空洞从能量上排除(见注 20)。
3.2.3.2 极性核心残基
与平行盘绕螺旋相似,与对应掩埋的极性残基也在规定螺旋取向上起到关键的作用。
( 1 ) 在平行盘绕螺旋中,普遍地观察到 a-a' 的 Asn 配对 ( 见 3.2.1.2 )。但是,在反平行盘绕螺旋中,对应的 a-d' 位并未观察到这种配对(综述见参考文献 [47])。确实,在反平行盘绕螺旋中的 Leu-Leu 相互作用比在平行的核心堆积中更稳定 [49],并且很可能是 Asn-Asn 相互作用和静电相互作用(见 3.2.2.3 和 3.2.3.3 ) 导致平行构象相对于反平行构象的特异性。
( 2 ) 尽管在天然蛋白中没有 Asn-Asn a-d' 配对,Oakley 和 Kim 修饰了平行杂二聚盘绕螺旋肽拉链,使得仅当螺旋在反平行取向时,才可以存在掩埋的极性相互作用, ( 即 a-d' 配对;参考文献 [56])。据估计,这一掩埋的极性相互作用给予约 2.3 kcal/mol 中等程度的反平行偏向(见注 21)。但是,仅在掩埋的极性相互作用与引进平行取向时电荷排斥两者结合时,才能排它性地形成反平行盘绕螺旋 [见3.2.3.3 (2)]。
( 3 ) 与在平行二聚盘绕螺旋中存在的 a-g' 或 d-e' 相互作用可以比较(见 3.2.2.2 ), a-e' 或 d-g' 相互作用可以出现在反平行盘绕螺旋中。例如,在丝氨基 tRNA 合成酶盘绕螺旋中,一条链上 d 位的 Arg-54 和另一条链上 g' 位 的 Glu-74 [ 57],或者在 GreA 盘绕螺旋中的 a-e' 相互作用。据假定,这种类型掩埋的极性相互作用也可能在取向特异性中起作用。Oakley 的小组取代了肽拉链的核心 Asn 残基对,以使得在反平行取向中,Acidpi 的 a 位 Arg可以与 Basepl 的 g' 位 Glu 作用(见注 22;参考文献 [59])。平行构象的稳定性会被潜在的 e' 位 Lys 的排斥作用降低。但是,与 Campbell 和 Lumb 的研究一致 [ 见 3.2.2.2 ( 2 ) 和注 14;参考文献 [38]],虽然核心引进 Arg 后能够促进二聚化,但并未发现对反平行或平行取向有明显的偏好。两种状态的自由能差估计仅有(0.1±0.1 ) kcal/mol。一个可能的解释是归因于与邻近的 g 位 Glu 形成了螺旋间相互作用。
3.2.3.3 边缘残基
在平行盘绕螺旋中,极性的 e 位和 g' 位产生有利的作用。在反平行的盘绕螺旋中,e 与 e' 作用,g 与 g' 作用,结果是一个螺旋被等效地旋转了 180°。这种倾向性的改变,在取向选择上有着重要作用。
( 1 ) Monem 等设计了平行的和反平行的盘绕螺旋,预计会有链间吸引或排斥 ( 见注 23; 参考文献 [49] )。确实发现,在主要的取向中有带相反电荷氨基酸间的静电相互作用。
( 2 ) Oakley 的小组改进了早先设计的反平行杂二聚盘绕螺旋 [见 3.2.3.2 (2)]。 在他们的第一个设计中 [56],在 e 位和 g 位,一条肽链仅含 Glu,另一条肽链仅含 Lys ( 见注 21)。在他们的新设计中,替换了每条肽链的 g 位残基,以使得所有潜在的吸引作用都预计只在反平行取向存在(见注 24;参考文献 [60])。相反,两个潜在的库仑排斥作用预期存在于平行取向中,并且确实证实了反平行排布的强烈向。
( 3 ) 在最近设计的反平行齐二聚盘绕螺旋 APH [ 也见 3.2.3.1 (3)],N 端 e 位和 g 位的 Glu 与 C 端 e 位和 g 位的 Lys 被用来引导反平行取向,结果在反平行排布得到 8 个潜在的库仑作用,在平行排布得到 8 个潜在的排斥作用(见注 20;参考文献 [55])。
3.2.4 稳定性
达成有利的稳定性是大量效果相反的焓和熵的净结果。结果是得到一个具中等程度稳定性的蛋白质,进化后可以在生理条件下与其伴侣蛋白相互作用,但不是稳定到不会解离的程度。达到这个平衡,是核心和边缘残基以及它们的相互作用、螺旋长度、成螺旋的倾向、溶解度和螺旋戴帽的结果。本节讨论这些稳定化因素。
一个重要而微妙的因素是溶解度。参与的螺旋必须有一非极性内核,以容许有利的相互作用,但螺旋的整体非极性必须不至于强到在工作条件下发生聚集。残基 a 和 d 必须形成一个连接两个螺旋的疏水带,e 和 g 典型地应该是极性残基,参与保证只有真正的结合伙伴与螺旋作用(即与非作用伙伴结合时变得不稳定),并增强核心导致的稳定性。这把剩下的残基留在了七元重复中的位置 b、c 和 f 上,以使电荷平衡和保证螺旋稳定且可溶。Glu 和 Lys,也有非常适合的螺旋倾向。带电残基也可与螺旋偶极有利地作用 ( 见 3.2.4.3 ),还可以与螺旋内一圈以外的带电残基有利地作用。这给予在离开二聚界面的地方,暴露于溶液的位点选择这些残基的额外优点。在溶液暴露位置插入 Tyr 有利于肽浓度测定。粗略地说,对原型的二聚盘绕螺旋,如 GCN4 和 Jun 蛋白,在这些位置Lys、Asp、Arg、Glu 和 Asn 有优势。虽不常见,但也存在的是 Ala,也许在附近空间的残基引起整体 α 螺旋倾向降低的情况下,可以认为它给螺旋以额外的稳定性。
3.2.4.1 螺旋长度
一般来说,在盘绕螺旋链长度增加时,观察到稳定性的(线性)增加 [61] 。这是因为盘绕螺旋的序列将会起到额外的重要作用。例如,Lau 和 Hodges 构建了一个比原肌球蛋白( 284 残基盘绕螺旋)还稳定的 29 聚体(见 注 25;参考文献 [ 62] )。在增加了的疏水掩埋、氢键以及极性相互作用的基础上,可以期待,当长度增加时, 盘绕螺旋结构变得更加稳定。在对设计的齐二聚肽的长度研究中(见注 26;参考文献 [63] ),这已被证明。虽然最短两个七元重复(见注 27;参考文献 [ 64 ] ) 也是需要的,在同三聚体的情况下容许结合。Lac 阻遏蛋白的盘绕螺旋结构域被用来作为检测链长对稳定和折叠的效应的基础 [ 65 ] 。毫不奇怪,四聚体的解离常数随每个螺旋 中七元重复数的增加而降低(见注 28 )。有些更令人惊奇的事实是,每个螺旋少到 4 个的七元重复协同地折叠,并没有二聚中间物的迹象。
与短盘绕螺旋相反,长的盘绕螺旋,如像原肌球蛋白和肌球蛋白重链结构域,并不在它们的核心排它性地富含大块的非极性氨基酸。更恰当地说,由于蛋白质长度所提供的稳定性,这样的蛋白质含有小的非极性或带电残基[ 66] 。这些残基约占到核心的 40%。这些不利于稳定的残基集团主要由 Ala 组成,因为这种残基比起极性残基来说对核心的稳定性损害较小(比极性侧链更容易堆积),并能增加整体的螺旋倾向性。这意味着,尽管获得正比于七元重复数的稳定性增加,但并未在这些长盘绕螺旋中观察到,从进化的观点来看,这样高的稳定性增加是不必要的。作为代替,疏水稳定的残基集团为盘绕螺旋提供必要的稳定性,而使稳定性降低的残基集团却不提供稳定性,但它们确实维持螺旋结构。这些主要含 Ala 的残基集团,在这些区域增加游变性和局部的去折叠,却不影响盘绕螺旋的整体稳定性,很可能允许蛋白质行使其独特的生物功能。
3.2.4.2 螺旋倾向
据 Litowski 和 Hodges 报道,通过把 Ser 改变为 Ala ( 具最高螺旋倾向性的氨基酸)来增加非核心残基的 a 螺旋倾向,可以稳定整个的盘绕螺旋 [ 67] 。在它们的模型----Glu/Lys 盘绕螺旋(见注 29 ) 中,这导致每个替换 0.4~0.5 kcal/mol 的稳定化。这与早先 O'Neil 和 DeGmdo 的结果相符 [68] 。这个数值小于对单个 a 螺旋的值,可能是因为维持盘绕螺旋涉及额外的稳定化相互作用。
一般来说,外部残基 b、c 和 f 应该与溶剂形成氢键,并且在同时,补偿潜在的不再能与之形成氢键的伙伴 [69] 。这些残基也负责帮助维持 α 螺旋倾向,其中每个残基都有一个构型偏好,或者稳定化或失稳化螺旋 [68] 。Ala 的 a 螺旋倾向已知是所有氨基酸中最高的,并且虽然所有普通的核心疏水残基(Asn 为例外)都有高的 a 螺旋倾向,溶液暴露的 Arg 和 Lys 也起一定的作用。这是因为 Lys 和 Arg 两者都是很好的氢键伙伴,并且非常适合用来改善分子的溶解度。确实,我们发现,螺旋倾向性在盘绕螺旋设计中是一 个重要的因素。 (http : //ww w. molbiotech. uni- freiburgode/bC IPA)。
3.2.4.3 与螺旋宏偶极的相互作用
蛋白质结构中 α 螺旋组成的统计分析揭示不同的氨基酸偏好螺旋的不同部位。特别地,带负电能力的残基(Asp 或 Glu ) 强烈地偏好接近螺旋的 N 端,而带正电能力的残基(His、Arg 或 Lys) 稍弱地偏好 C 端 [ 71,72] 。解释极性侧链对螺旋末端偏好的模型可以分为两类。第一,因为 α 螺旋的头 4 个主链 NH 基团和最后 4 个 CO 基团不能与其他的主链基团形成 i→i+4 主链氢键,螺旋末端的极性侧链则可以代为氢键伙伴。这称为螺旋戴帽并在3.2.4.4 节有描述。第二,带电侧链和由单个肽骨架偶极排列形成的 α 螺旋净偶极矩之间的静电“电荷-螺旋偶极”相互作用也可以使蛋白质稳定或失稳。
( 1 ) Hodges 研究组研究了带负电的 Glu 侧链,对一个设计的、没有螺旋内和螺旋间相互作用的、齐二聚盘绕螺旋稳定性的影响的位置效应(见注 30;参考文献 [73])。在盘绕螺旋的每一个链的近 N 端,一个取代 Gin 的 Glu 在 pH 7.0 使盘绕螺旋稳定,与电荷-螺旋偶极相互作用模型相符。相反,在螺旋中部用 Glu 替换会降低螺旋稳定性,因为在 pH 7.0 相比于 Gln,Glu 的螺旋倾向和疏水性更低。在 C 端的 Glu 被替换则更加降低盘绕螺旋的稳定性,这是因为本身带有的降稳定性能力,和与螺旋偶极矩的负极间不利的电荷-螺旋偶极相互作用的综合效果。
( 2 ) 在从两个在 4 个 a 位和 4 个 g 位含 Glu、Gin、Arg 和 Lys 残基等摩尔混合物的设计的蛋白质库中挑选杂二聚盘绕螺旋时(见注 7 ),Amdt 等观察到,在选出的盘绕螺旋序列中,带负电的 Glu 和中性的 Gin 在 N 端部分的富集,以及带正电的 Lys 和 Arg 在 C 端部分的富集。这种偏好与假设的电荷-螺旋偶极相互作用符合得很好。
3.2.4.4 螺旋戴帽
螺旋可以标记为 N'-Ncap-N1-N2-N3-N4-mid-C4-C3-C2-C1-Ccap-Cy。在这些位置中,N'、Neap、Ccap 和 C' 没有螺旋的平和中角,并且 N1-N2- N3···C3-C2-C1 参与作为 α 螺旋特征的 i→i+4 氢键。残基 N1、N2、N3、C1、C2 和 C3 是唯一的,因为它们参与 i→i+4 骨架 -骨架氢键的酰胺基只使用 CO 基(在 N 端)或者 NH 基(在 C 端) ( 见 3.2.4.3 )。这些残基对形成氢键在螺旋结构和稳定性上有强有力的影响「 74 ] 。从 N4 或 C4 往上,所有残基都可以满足 NH 和 OH 骨架氢键条件。
( 1 ) 在螺旋设计中,在 N 端对稳定性最具选择性的位置是 Neap 位。对这个位置 6 个最适合的残基是 Ser、Asp、Thr、Asn、Gly 和 Pro,另外有 11 个残基(Val、lie、Phe、Ala、Lys、Leu、Tyr、Arg、Glu、Met 和 Gin ) 被完全排除 [ 75 ] 。对 Neap 的 6 个最适残基中,Ser、Asp 和 Thr 是最好的。
( 2 ) Neap 模体的一个好例子是 Ser- Xaa- Xaa-Glu (Ncap- N 1- N 2- N 3 ) ,其中反向的侧链/主链相互作用样式( Neap 位 Ser 的 OH 与 Gki 的 NH,以及 Ghi 的羰基与 Ser 的 NH ) 使螺旋稳定。进一步的稳定可通过 Ser- Xaa- Xaa- Glu 模体前后的疏水残基达成 [76] 。Lu 等在 GCN4 的序列中引进了这一戴帽样式,因此而使盘绕螺旋达到 1.2 kcal/mol 的稳定水平(见注 31;参考文献 [77])。
( 3 ) N1 位 和 C' 位很喜欢 Pro ( 在立体化学上是相容的,因为前面的残基具有非螺旋的骨架两面角),这确实是一个共同的螺旋终极模体,但必须避免出现在螺旋主体中,以及 C3、C2 和 Ccap 位。作为所有氨基酸中溶解度最髙的 Pro 与螺旋末端的溶液暴露位是相容的 [78] ,并且不需要氢键受体,因为它没有骨架 NH 基团 [76] 。
( 4 ) C 端戴帽模体包含骨架-骨架氢键,而不是在 Neap 和 N3 之间观察到的侧链到骨架氢键。在 C 端骨架,氢键由螺旋后骨架基团来实现(如 Schellman 模体中的 C' 和随后的 C'';参考文献 [76])。这意味着,C 端只在 C' 位需选择可以取正$角的残基,如 Gly。
3.2.5 理性设计与选择技巧
蛋白质设计的复杂本性意味着设计或预选具有高稳定性的序列是一件令人畏缩的任务。如果程序允许,宁愿生成一个相互作用库—— 可检查其序列是否有成功的相互作用的不同分子的集合。这可认为是半理性的设计,凭此可在库中引进特定位点的平衡变化(经常维持野生型残基不变),得到的大量分子组合可供筛选。正常情况下,在类似的设计中,要改变所有七元位为所有可能的氨基酸,将会产生大而不现实的库容(如果含 4 个七元重复,每个位点有两种可供选择的氨基酸,将会产生 228 = 2.68 X 108 库成员)。但如果只需产生一条待合成并测定结合强度的序列,则会是耗时且枯燥的,而且结果常会是令人沮丧的。采用半理性设计,可得到合理的折中,一个分子可以包含在库中,测试它是否确实是一个用于结合的优秀候选者,同时,提供多功能以产生新的、 非直觉的、并常常是全新的结合伙伴。在基于细胞的系统中的选择,具有更多额外的优点,可以伴随地筛选出对该有机体内的蛋白酶敏感的序列。
3.2.5.1 简并密码子
使用简并密码子,可在希望改变的位点上编码若干氨基酸的混合密码。同样,在仔细选择要随机化的对应位点引入简并密码子,不仅可以引入期望的碱基,而且可以引人期望的氨基酸。如已经讨论过的,盘绕螺旋在不同位置对氨基酸类型有偏好。例如,e 和 g 残基常是极性且互补的(表 3. 4),因而,Glu-Lys 相互作用可以替换 Glu-Arg 相互作用,对分子结构只有极少扰动(因为 Lys 和 Arg 在体积与电荷上相当相似)。在这种情况下,Arg 可以引进,而 Lys 可以保留在库中,以观察从分子整体上看,哪个氨基酸更适合。同样地,疏水核心在a 位偏好 β 分支氨基酸,这意味着,虽然在野生型中可以期待找到 Val,lie 也许更合适。但是,必须注意到,执着于这些偏好则是过分简单的,表面上不利的残基对设计非特异结构和甚至整体稳定结构是必需的(见参考文献 [8])。但是,一般来说,保持整体的“两元样式”将能够保证得到所有的库中成员,有合理的机会形成盘绕螺旋结构,而不是能量上有利的其他结构。盘绕螺旋库成员将像野生型结构所做的那样,掩埋它们的疏水残基,并用极性的 e 和 g 残基将这些疏水残基包围起来。对一个盘绕螺旋来说,疏水核心的维持,称为 “ 3-4重复”(a 到 d 和 d 到 a 分别是 3 和 4 个残基间隔)是基本的。最后,可能合成特异的三核苷酸聚合物,使得到的基因序列编码,并只编码期望的最终氨基酸序列 [79] 。这也有助于在容许更多期望的待筛选的变化的同时,保持低库容。对使用正规的简并寡核苷酸的简并密码子,情况不是这样的。依赖于密码子用法表,可能意味着为了有两个期望的氨基酸,另一个不期望的氨基酸必须包含在那个位置(见 3.2.5.2 和图 3.2 )。也有可能,在密码子表相反两 端的两个氨基酸是期望的,但是在现实中,只能用这样预先合成的三核苷酸密码子才能包括进来。这样的三核苷酸建筑模块近来已商品化(Glen Reserch,Sterling, VA;Metkinen Oy,Finland)。
3.2.5.2 密码子偏向
密码子偏向是指一种而不是另外一种密码子将编码一个特定的氨基酸(图 3.2A )。例如,在大肠杆菌中,CGT 编码 Arg 的次数比 CGA 多 5 倍。很明显,当用包含编码库中多肽的基因的质粒转染细胞(如大肠杆菌)时,必须选用在宿主有机体中常用的三联体,而不是不常用的密码子,后者可能导致可读框移位 [ 80~82] 或库中代表性不好的序列。还有,在设计用于筛选的库的情况。例如,希望引进 β-分支氨基酸的所有组合到 a 位,但这取决于密码子的用法。图 3.2. 显示某些我们最喜好的密码子组合,用于盘绕螺旋的不同位置。大多数组合只包括少数选项以使库维持在合理的大小。通过检查图 3.3 ( 大肠杆菌密码子用法;对此或其他有机体见 www.kazusa.or.jp /condon) 我们见到,如果要盘绕螺旋的 a 位包括 Val、lie 和 Thr,需要密码子 GTN、ATH ( 如果 Met 必须避免)和 ACN。这会意味着在密码子的第一位需要 G 或 A,第二位需要 T 或 C,并且第三位需 要除 G 以外的任何其他核苷酸,因为 ATG 会编码 Met,导致简并的密码子 RYH ( 所有作为结果的密码子都是大肠杆菌经常使用的)。但是,对于 Val、lie 和 Thr 的组合,不可能排除库中不需要的氨基酸,因为上述核苷酸的混合也会包括编码 Ala 的 GCH。
另一个例子是,如果想包括氨基酸 Gin、Asn 和 Lys,则根据默认的编码,必须也包括 His。但通过合成只编码那些需要的氨基酸的三联核苷酸,这个问题是可以克服的 [ 31,79] 。另外,必须仔细排出表示得不好的密码子。例如,在表示 Arg 时就会遇到这种情况,因为在大肠杆菌中短缺 AGG 和 AGA 密码子的氨酰基 tRNA 合成酶。最后必须注意,如果一个位点在库中需要无偏向的表示,那么在那个位点上对所有氨基酸都应该选用 1 : 1 的比例(与代表它们的密码子一样)。在一个简并位上,某一个氨基酸比另一个氨基酸更多地表达,会自然地把对应于此差异的偏向引人体系中,因为那个氨基酸得到了更多的表达。
3.2.5.3 筛选系统
向盘绕螺旋开放的最常用筛选系统是蛋白质片段互补测试选择。在这个测试中,相互作用的蛋白质,如两个盘绕螺旋片段,被系在报告蛋白的两边上,仅当两个融合蛋白或多肽结合的时候报告蛋白才被激活。这已被用于二氢叶酸还原酶、泛素 [89] 、β-半乳糖苷酶 [ 90 ]、β-内酰胺酶 [ 91,92 」和绿色荧光蛋白 [93] 这样的胞内测试,有同时抗蛋白酶敏感或抗毒性多肽选择的额外优点。
用于盘绕螺旋的另一个筛选系统是酵母双杂交系统。在这个系统中,一个螺旋被融合于 Gal4p 转录因子的结合结构域(它与一个启动子结合),而另一个螺旋则融合于其活性结构域(它与聚合酶相互作用)。只有两个螺旋间的相互作用能够把两个嵌合蛋白拉到互相接近的位置并允许转录激活子起作用,并因而激活可以测试活性的报告基因 ( 如 β-半乳糖苷酶 ) 。使用这一系统,可从一蛋白质库中筛选到一个蛋白质或结构域的新的相互作用伙伴( 最新的述评,见参考文献 [94])。
λ 抑子系统,是基于通过用一杂寡聚化的结构域取代其 C 端结构域,使大肠杆菌 λ 阻抑子的活性重新恢复。当 C 端结构域与自身(同型相互作用)或来自另一个融合蛋白的不同的结构域(异型相互作用)形成二聚体(或更高的寡聚体)时,就探测到阻抑作用。或者通过模拟噬菌体感染免疫,或者通过检测对 β-半乳糖苷酶那样的报告子的阻抑,可以探测到功能阻抑子的存在 [ 95,96] 。
最后,通过噬菌体展示,蛋白质可以展示在丝状噬菌体的表面外壳蛋白上。从展示在噻菌体上的多肽库中可以挑选结合者通过几轮挑选来浓缩。这一技术也容许挑选与非天然化合物结合的蛋白质 [97]。
3.2.5.4 与设计有关的计算
某些研究组不使用体内选择系统,而是使用计算的方法得到盘绕螺旋的有希望的序列。本节讨论与此有关的问题。
( 1 ) Keating 等发展了一种计算方法,以预测疏水核心突变对相互作用特异性的效应 [98]。通过使用一种算法,综合范德华堆积作用能,溶剂化效应和 a 螺旋倾向性,来达到此目的。据此,可预测来自于核心堆积的伴随偏好。设计了核心 a 和 d 残基突变为 Leu、lie 和 Val 的盘绕螺旋,以产生 6 个不同稳定性的不同的杂二聚体(见注 32)。该算法可以预测稳定性,并与实验数据很符合。
( 2 ) Mayo 的小组使用设计的算法估算表面蛋白相互作用。他们检测了 3 个打分函数:氢键位能,与没有补偿的极性氢掩埋罚分相结合的氢键位能,氢键位能与螺旋倾向结合 [69] 。对这 3 个打分函数中的每一个,以 GCN4 - pl 为例(见注 2 ),用该算法找到优化的氨基酸序列,并合成相应的多肽。得到的所有多肽都是二聚的;在 1°C ,近 100% 是螺旋的;较之于具有随机分布的表面亲水残基的 GCN4 多肽的 15°C,熔融温度为 69~72°C。数据建议,在盘绕螺旋多肽表面残基的序列设计中,螺旋倾向性是关键因素。
( 3 ) 为了要生成具有右手超螺旋缠绕的盘绕螺旋,发展出了一种算法,即加入了对主链游变性的处理 [99] 。因为要用固定主链的话,一个已经存在的例子便可提供坐标定位,即使这样,这些数值对近同源调整后的序列可能并不适合。通过骨架的游变性,可从一小组主链构象中取样。这些取样然后再与侧链堆积取样相耦合。结果,以计算方法设计出了右手二聚的、三聚的以及四聚的盘绕螺旋(见注 33 )。疏水极性残基构成的样式规定蛋白质的整体折叠。寡聚态、主链构象以及侧链旋转异构通过计算,在不同的主链结构中找到最好的堆积来选择。得到的多肽正确地形成与设计目标一致的寡聚态,四聚体 X 射线结构与设计的结构在原子细节上相符。
( 4 ) Harbury 的一篇文章结合了正向(期望的结构)和负向(远离不期望的其他结构)设计,以优化相互作用的特异性 [ 见3.2.2.2 ( 3 ) ; 参考文献 [39]]。 GCN4 中心七元重复的 a 位、d 位、e 位和 g 位改变为所有非脯氨酸残基,以产生大约 8 X 109 个可能的序列(见注 15)。该算法类似于计算的双突变循环,其中的多肽是序列优化的, 而不是结构优化的。考虑过的能量竞争态有:
a. 折叠齐二聚期望结构;
b. 能量上有利的杂二聚体;
c. 未折叠的能量不稳态;
d. 难溶聚集态。
对于候选序列,这 4 种竞争态中的每一种都计算了自由能。这种所谓的“多态”设计比单态设计体系有一个优点,后者只寻找目标的最低自由能。不像这些设计,多态设计的结构常常偏离 PV 假定,并且同时,考虑到一些因素,如引起聚集的过多的疏水暴露和降低稳定性的过多的极性掩埋。更适当地,这种设计考虑了所有这些因素,当这些竞争的力支配对目标态的选择时,这种设计才需要改变。因而,选择是稳定性和特异性间平衡的结果,而不仅仅是目标稳定性。
3. 2. 1 寡聚态
为正常地发挥功能,任何蛋白质都必须折叠成合适的三维结构。类似地,盘绕螺旋结构必须采取正确的寡聚( 四级)结构。在下一小节,讨论实现正确结构的主要因素。
3.2.1.1 核心残基
图 3.1,我们称 a 和 d 残基为核心残基,因为它们绕着每一个螺旋形成疏水带。 a 和 d 重复残基的非极性本性,有利于沿着每一螺旋的一面发生寡聚。这与在球蛋白折叠时蜷缩成的疏水核心类似,并代表对盘绕螺旋整体稳定性的主要贡献。结果是,核心残基在定义寡聚态上发挥主要的作用。
位置 a 和 d 上的疏水侧链,以 “杵适配臼”(knob- into - hole) 的方式掩埋于相邻螺旋中,并最先由 Crick 在 1953 年所描述 [ 15 ] 。在这一模型中,一个 a 螺旋的一个侧链 ( 杵),插入对面的 a 螺旋上的 4 个侧链围成的空间(臼)中,反之亦然。堆积几何被 Cα—Cβ 键与臼底部的 Cα—Ca 向量构成的角在螺旋底部的投影所定义。对平行二聚体而言,位置 a ( 七元重复位置 i ) 的杵,适配到另一个螺旋的由位置上的残基顺时针排列(如果对着空洞看去)而成的臼中。因而,di 位的杵是在 a'i、d'i、e'i 和 a'i+1 围成的臼中(图 3.1)。
对 GCN4 ( Jun 转录因子的酵母同源物,有时称为 GCN4-p1,见注 1 ) 盘绕螺旋不同核心突变的全面而完整的分析,揭示了不同寡聚态的不同堆积几何(表 3.1;参考文献 [ 16 ])。GCN4-p1 二聚体 X 射线结构中的侧链堆积,和一个设计的四聚 GCN4 突变体的比较,证明 a 层和 d 层的局部几何被翻转了。平行的杵适配白堆积在二聚体的 3 层和四聚体的 d 层。相反,垂直的杵适配臼堆积,在二聚体的 d 层和四聚体的 a 层。在平行的三聚变体中,在 a 和 d 位发现了第三类的杵适配臼堆积 [17],在这两层中,每个杵的 Cα—Cβ 键与在对应臼底部的 Cα—Cβ 键成近似的 60° 角。这一安排称为“尖锐” 的杵适配臼堆积。
这些不同的几何关系,解释了一定的寡聚态有独特的氨基酸偏好。下面列出几个实验结果,这些实验测试不同氨基酸对稳定性和寡聚特异性的影响。
( 1 ) 特异的疏水残基在强制盘绕螺旋采用何种寡聚态上是关键的。Harbmy 等系统地把 GCN4 ( 除 a1Met 外)所有的 a 和 b 残基改变为 Leu、Val 或 lie ( 见注2 ; 参考文献 [16])。如表 3.1 所示,这使得盘绕螺旋采用不同的寡聚态。GCN4- IL ( IL 指 a 位的 lie 和 d 位的 Leu)、II 和 LI 突变体分别是二聚、三聚和四聚,并且在研究的整个浓度范围内(寡聚态)与浓度无关。VI、VL、LV 和 LL 突变体以多种方式寡聚。 L、V 和 I 的每一个组合给出独特的堆积偏好,因而形成独特的几何特征。
a. 带 β 分支的残基(Val 和 lie ) 适合于平行的杵适配臼堆积(二聚体的 a 层和四聚体的 d 层),而 γ 分支的残基 Leu 适合于垂直的(二聚体的 d 层和四聚体的 a 层)几何特性。相反, β 分支的氨基酸插入垂直位,需采用热力学不利的旋转构象态 [18] 。
b. 很有可能,lie 和 Val 虽有相似的立体化学,但在建立寡聚态上是不等价的。在 a 位 的 Val 导致二聚体的能力比 lie 弱。与 Val 导致二聚-三聚混合物相反,lie 给出较高的二聚特异相互作用。
c. 与二聚体和四聚体结构相反,三聚体内部的堆积,在两个疏水位点,可以适应具有最适旋转构象态的 β 分支残基。
( 2 ) 在 Woolfson 和 Alber 的研究中,包括了对核心残基作用的研究,并把这些作用用来衡量七元重复残基的二聚和三聚倾向 [19] 。分析二聚体和三聚体的特性,并用这些特性来鉴别新的序列。掩埋的 Leu、lie、Asn、Lys 和 Gin 在其预测算法中是关键的,称之为 COILER。总的来说,使用了 21 个已知形成二聚体和三聚体的不同的蛋白质,相当于数据库中的 721 个七元重复。
a. 在起先考虑的 7 种氨基酸中(Ala、Phe、lie、Leu、Met、Val ) ,只有 a 位的 lie 和 Leu 以及 d 位的 Leu 在统计意义上被观察到。二聚体偏好 a 位富集 lie 和 d 位富集 Leu,而二聚体中的 d 位几乎没有 lie。很清楚,在这些位置上对氨基酸的这些选择使二聚体的形成有最好的堆积几何 [ 见 3.2.1.1 中(1 ) 和 表 3.1]。
b. 在盘绕螺旋序列的核心部位,Val 比 lie 分布得更均匀。在二聚体和四聚体的 a 位 和 d 位,Val 出现的频度甚至低于随机分布的预期值。这些结果与观察到的下述事实相符:a 位和 b 位的 Val 很难区分盘绕螺旋的二聚态和三聚态 [ 第 3.2.1.1 中(1 ) 和表 3.1]。
c. 三聚体中 a 位 和 d 位的堆积是差不多的,这些位置对氨基酸少有特异性,使得疏水氨基酸的分布更均匀 [ 16,19] 。
( 3 ) 在研究设计好的反平行盘绕螺旋核心位置的丙氨酸的位置效应时(见注 3 ),Monera 等发现,当丙氨酸残基在适当位置(即在同一个环上)时,会形成二聚体 [ 20 ] 。如果丙氨酸残基不同步,会形成四聚体。对此,最可能的解释是,四聚体中同步丙氨酸形成的孔穴高度地不稳定,因而倾向于形成二聚体,而 Leu-Ala 重复使孔穴分布在较大范围内,从而减少在疏水掩埋和范德华相互作用上的损失。这证明了寡聚特异性是核心残基堆积引起的。
( 4 ) 软骨寡聚基质蛋白质(COMP ) ,属于血小板反应素家族,包含 5 链的非常稳定的平行 α 螺旋盘绕结构。46 个氨基酸长的盘绕螺旋区域(见注 4 ) 包含环分子间(即螺旋与螺旋间)的半胱氨酸二硫键 [21]。五聚界面展示出杵适配臼堆积。a 位、d 位、e 位和 g 位残基构成若干杵,它们堆积入相邻亚单位的 a'-g' 位、d'-e' 位、c'-d'位和 a'- b' 位侧链围成的臼中。只有 f 位残基是完全暴露的,而其他 6 个位置的残基是明显被掩埋的。GCN4-pLI 突变体 [ 见 3.2.1.1 中(1 ) ] 和五聚的 COMP 结构都含有一个大的轴向孔洞。在四聚体中的隧道大小为 1.0~1.3 A [16],并因此而排除了水分子(半径 1.4A)。相反,沿着五聚体的小孔有几个小分子,这与其隧道的半径较大(2~6A)一致。
( 5 ) 把 d 残基改变为性质上更疏水的非天然氨基酸(三氟亮氨酸和六氟亮氨酸)的实验显示稳定性增加(见注 5;参考文献 [ 22 ] 和 [ 23 ])。
( 6 ) 用单甲基、双甲基和三甲基化的二氨基丙酸(dap) 类似物研究了 a/d 界面上的疏水掩埋,结果显示疏水性增加 [22] 。甲基加入一个单体的第 16 位(在类肽的第 16 位用天冬氨酸)时,使随后得到的杂二聚 GCN4-p1 ( 见注 6 ) 更稳定,可能是由于折叠状态的范德华相互作用得到增加和降低了折叠的溶解损失。但是 3 个甲基的加入降低了稳定性,可能是由于增加了立体化学的位阻。奇怪的是,2 个甲基加入合成的 dap 后,引起了齐三聚( 相同蛋白质或多肽的结合称为齐聚或同聚——译者注)。这证明了即使是小的尺度和疏水性的变化也能够改变稳定性与折叠倾向。
简而言之,在二聚的盘绕螺旋中,核心位置氨基酸的最好选择可能是 d 位 Leu、a 位 ( β 分支的 lie ( 或 Val)。如果使用了 Val,Asn ( 如同在天然盘绕螺旋中普遍见到的)就应该相应地放在中心 a 位,以增加相互作用的特异性(见 3.2.1.2 )。三聚体的最好设计是核心位都用 lie,而四聚体最好在 a 位用 Leu,d 位用 lie。对这种 β/y 侧链分支 ( 残基)安排的偏离,会导致不利的旋转异构能,降低所期望的结构稳定性,并可能产生盘绕螺旋的多种寡聚态和反平行结合态的混合,也就是使得特异性降低。
3.2.1.2 极性核心残基
与核心残基整体上疏水相反,大约 20% 的核心残基是带电的 [ 25 ] 。这些带电残基通常起到使结构形成正确寡聚态的作用,大概是通过保证螺旋在结构中按需要的方式排布,否则结构将以二聚、三聚和(或)四聚,以及平行和反平行混合物的形式存在。但是,通常在特异性上的所得,总伴随着稳定性的降低。以下列出这些残基在特异性和稳定性上的作用。
( 1 ) 在关于二聚体和三聚体的统计分析中 [ 见 3.2.1.1( 2 ) ] ,Woolfson 和 Alber 观察到:
a. 二聚体中 Lys 和 Asn 偏向于在 a 位,而三聚体中则基本没有。在二聚体的 a 位找到 Asn 的可能性比在三聚体中大 3 倍。
b. 三聚体的 a 位富含 Gln,Ser 和 Thr 则富集在 a 位或 d 位。
c. 常常与侧面 e 位和 g 位上的谷氨酸一起,在 a 位找到掩埋的赖氨酸。例如,这可以在 Jun/Fos 杂二聚体 [26] 以及 GCN4 Asn6Lys 突变体的 X 射线结构中找到 [ 见 3.2.1.2 ( 5 );参考文献 [27] ]。
( 2 ) 掩埋的 Asn 对(在处于合适的位置时),可能通过两个螺旋的两个 Asn 侧链之间生成的氢键,给二聚体以特异性,这一现象确实在 X 射线 [6] 和核磁共振 [28] 研究中被观察到。不满足 Asn 侧链的氢键位能的其他构象因而在能量上是不利的。
( 3 ) 如果 GCN4 -p1 核心 a 位的 Asn ( 见注 2 ) 被替换为 Val,以二聚化的特异性为代价,盘绕螺旋的稳定性大量增加。因为与 lie a 位的 Val 使得特异性缺失,Harbury 等报道得到了二聚体和三聚体的混合物 [ 见3.2.1.1 ( 1 ) 和表 3.1;参考文献 [16] ];同时,Potekhin 等报道了三聚体生成 [29] 。
( 4 ) 在另一个例子中,平行杂聚肽(见注 1 ) 的核心 Asn 对突变为 Leu 对(产生 Acid- pLL 和 Base-pLL 多肽),得到平行和反平行四聚体混合物 [ 30 ]。
( 5 ) 在 GCN4 的情形(见注 2 ),Alber 组把核心 a 位的 Asn 对改变为 Gln 和 Lys,以研究这是否也能得到寡聚特异性。Lys 产生的二聚体与野生型相似,而 Gln 产生二聚体和三聚体的混合物 [27]。他们推论为,极性基团制约的结构唯一性,不只是由极性掩埋引起的,也依赖于侧链与环境的正确相互作用。这些与上下文有关的效应,比起仅只是给定的七元重复位置的残基频度来,预测困难要大得多。
( 6 ) 当用一个蛋白质片段的互补试剂(见 3. 2. 5. 3 ) 二氢叶酸还原酶选择杂二聚的盘绕螺旋时,Arndt 等发现,在一个是 Val-Leu 的核心处,相比于 Asn-Val 或 Val-Val 组合 Asn 对构成的核心更受青睐(见注 7;参考文献 [31])。这与许多天然的盘绕螺旋相符合。
( 7 ) 在另一个研究中,二聚的 GCN4-pVL [ 见 3.2.1.1 ( 1 ) ] 的 a 位或 d 位被分别突变为极性残基 Asn、Gln、Ser 或 Thr ( 见注 8;参考文献 [25])。只有 a 位的 Asn 残基对和 d 位的 Thr 残基对能导致正确的寡聚态。可能是掩埋这些残基在核心中所损失的溶解能,被它们间的相互作用能所弥补,因而也能保证正确的螺旋安排。
( 8 ) 堆积环境的差别使疏水残基有不同的倾向性,即使是在 a 位和 d 位。在两个应用 a 位为 Val、d 位为 Leu 的模型多肽的透彻研究中,中心的 a 位和 d 位被系统地改变为每一种氨基酸,以测试它们在稳定性和寡聚态上的作用(见注 9;参考文献 [ 32 ] 和 [ 33 ])。这些改变,是有关疏水核心侧链替换对双链盘绕螺旋稳定性影响的第一个透彻的定量评估,并使得为 a 位和 d 位 19 种天然氨基酸建立热力学相对稳定性标度成为可能。表 3.2 列出了那些如果放在 a 位或 d 位会导致明确的寡聚态的氨基酸 [32]。A 位的 Leu-、Tyr-、Gin- 和 His- 取代类似物无一例外地是三链的,而 Asn-、Lyt、Om-、Arg- 和 Trp- 取代类似物无一例外地形成两链单体。在中心 d 位替换的时候,lie 和 Val ( β 分支残基)导致三链寡聚态 [ 见 3.2.1.1(1) ],而 Tyr、Arg、Lys、Orn、Glu 和 Asp 产生双链态。
( 9 ) Ji 等突变了 gp41—— 来自猿猴免疫缺陷病毒的 6 螺旋束包膜蛋白,与 gp120 一起,负责病毒与 CD4+ 细胞的融合 [ 34 ] 。在结构上,它是由反平行杂二聚体组成的三聚体蛋白。在这一研究中,为核心氢键和盐桥负责的(两个 Gln 和两个 Thr 残基)4 个被掩埋的极性残基的每一个,都单独地突变为 lie。其中,3 个形成更稳定的 6 螺旋束,另 1 个形成不溶的聚集体(见注 10)。这些结果证明了这些残基具有控制结构稳定性和特异性间平衡的能力。这是非常重要的,因为在融合之前,此蛋白质要经受结构变化,并必须在两个结构之间有正确的稳定平衡,以使得这种变化是可能的。这些极性核心残基协助调控此构象稳定性,因而,也协助膜融合本身。
一般来说,核心 a 位的 Asn 残基对显然在二聚体中占支配地位,特别是,如果核心偏离最优的 Ile-Leu a-d 残基布置的时候,因为这一组合似乎导致平行二聚,而不需要核心内的 Asn 对。核心的 a 位 Gln 对三聚体可能是好的选择,尽管为了确保三聚体排它的特异性,可能还需要其他一些因素。
3.2.1.3 边沿残基
七元重复的 e 位和 g 位(边)在盘绕螺旋界面上从侧面围着 a 残基和 d 残基(图 3.1)。这些位置的掩埋,高度地取决于寡聚态。结果,在 e 位和 g 位氨基酸的选取可能受到寡聚态的影响。表 3.3 显示掩埋面积的百分数,表示在螺旋单独存在时的侧链可及表面积在寡聚态中变成掩埋状的分数 [16] 。
( 1 ) 与二聚体中对应位置相比较,三聚体的 e 位和 g 位富含疏水残基(lie、Leu、Val、Phe、Tyr 和 Trp ) 并几乎没有特异的亲水残基(Glu、Gln、Ser 和 Arg;参考文献 [ 19 ] )。这些模式是与三聚体中疏水界面相对于二聚体的扩张相符的。疏水残基百分数的增加使狭窄的疏水面的宽度增加,并且高寡聚态的似然率也增加了。在高寡聚态中有比两螺旋的盘绕螺旋更多的非极性掩埋。这可以从表 3.3 中看出。在 e 位和 g 位的疏水掩埋百分比,大约增加了 40%。三聚体中在对面带电的 gi 到 e'i+1 残基对(12% ) 相对于二聚体(23% ) 的减少与此相符 [19] 。
( 2 ) Fairman 等突变了 lac 阻遏蛋白的 C 端同四聚盘绕螺旋结构域,以产生杂四聚盘绕螺旋 [ 35 ] 。在 e 位和 g 位周边的 b 位和 c 位,全为 Lys 或全为 Glu 的多肽,结合力很弱。但是,把它们混合起来,就会形成高度稳定的四聚体(见注 11)。这证明了,至少对于四聚体,b 和 c 残基在盘绕螺旋的稳定性上也起了重要作用。这种作用类似于二聚盘绕螺旋中存在的 g/e' 离子相互作用,但四聚体加宽了的疏水界面扩展到这些残基,离子作用从核心幵始向外后退到 b 和 c 残基。通过改变 pH 和盐的水平,Glu 和 Lys 间的这些离子对相互作用,被证明为对稳定性的增加负责。另外,这些电荷在齐性寡聚时直接相对,并且很可能在潜在的齐二聚相互作用体中,这一不利的电荷排斥推动了杂二聚体的形成 [ 9,35 ]。
3.2.2 配对特异性
本节讨论配对特异性的重要性,以及盘绕螺旋可以用来保证没有其他能量上有利的结构可以被接受的某些方法。引人注目的是,与序列和结构上的相似性相反,盘绕螺旋偏向于与功能上的伙伴相互作用。本节分析介导这种高特异性的因素。
3.2.2.1 核心残基
如 3.2.1.1 小节所述,疏水残基(主要是 Leu、lie 和 Val ) 分布模式是螺旋间结合的主要推动力。但是,因为这种模式非常常见,螺旋怎样能同时用其核心抗拒不同结构 的形成?答案是一个复杂的图像,包含微妙的变化,如非稳定化的、非疏水的核心残基的插入,这种变化会选择对抗另外种类的结构。
( 1 ) Sharma 等设计了一个多肽(anti- APCp1) ,其目的是用于结合来自腺瘤性结肠息肉(APC ) 的肠癌有关肿瘤抑制蛋白的盘绕螺旋序列(见注 12;参考文献 [36])。 这样,他们采用了核心改变以及结合 g/e' 相互作用,而不是 Asn 配对,以证实特异性可归因于这个相互作用。他们推理认为,考虑到核心残基在结合过程中的主导作用,以及核心突变对稳定性和特异性都有大的影响,发现在主导特异性上对核心残基的低要求是令人奇怪的。为了处理这个问题,他们设计了 1 个多肽,以结合到 APC 的头 55 个氨基酸(APC55 ) 上,并基于角蛋白的类型 I 和类型 II 杂二聚体在位置 a 和 d 的共变模式,突变了此 anti- APCp1,以产生更常见的 a-a' 和 d-d' 配对。他们做了 3 个突变(在 a 层的 A41 I、d 层的 A2M 和 M44A ),以把野生型的 Ala-Ala 和 Met-Met 相互作用分别变为更常见的 Ala-lie、Ala-Met 和 Met-Ala 相互作用。两个更进一步的突变(a 层的 T6G 和 d 层的 N30H ) 用对应的 Gly-Gly 和 His-His 对来降低齐二聚体的稳定性。在定向抗 anti-APCp1 齐二聚化的同时,额外的 e-g' 配对优化了离子相互作用,所得二聚体具有稳定性及特异性。
( 2 ) Schnarr 和 Kennan 通过核心疏水残基的立体化学配合形成了杂三聚蛋白 [37] 。 在他们的研究中,用各种不同侧链长度的非天然氨基酸来启动特异的杂三聚体形成。 研究者们把 GCN4 核心 a 位残基用 Ala 或环己基丙氨酸替代(见注 13),结果得到的是三聚体中立体化学不匹配的核心层,以 3 个 Ala 或 3 个环己基丙氨酸,产生立体规避或排斥。但是,2 个 Ala 和 1 个环己基丙氨酸产生了 1 个立体化学配合很好的杂三聚体。非天然侧链可以以这种方式产生盘绕螺旋。环己基丙氨酸的额外体积弥补了 Ala 核心层,以提供立体配合,而更大的侧链只会使分子不稳定。
3.2.2.2 极性核心残基
在 3.2.1.2 讨论了极性核心残基在引导螺旋特异的寡聚态上的作用。在 3.2.1.1 曾提到,在盘绕螺旋配对中的异型核心接触允许产生杂特异性。更多的特异性可通过极性核心与外沿残基的相互作用得到。
( 1 ) 在天然二聚盘绕螺旋中,a 位的 Lys 是仅次于 Asn 的最普通的掩埋极性残基 [19] 。A 位 Lys 可以与前 1 个七元重复的 e 位残基 [27] 形成螺旋内静电相互作用,以及与平行二聚体中,对面螺旋前 1 个七元重复的 g' 位的极性残基,形成螺旋间 g'-a 极性相互作用 [26]。
( 2 ) Campbell 和 Lumb 在肽拉链(PV) 的 Base-pLL 中放入了两个 a 位 Lys,以在肽拉链的 Acid-pLL 中实现螺旋间的由这 2 个 Lys 与 e' 和 g' 位的 Glu 残基提供的极性相互作用(见注 14;参考文献 [38])。正如所期待的,结果偏向于二聚态,很可能是因为在高寡聚态中会有较大的溶解损失。另外,这样的相互作用,相比于 Asn-Asn (a-a') 相互作用,对稳定性的损害较小,主要是因为后者有较大的溶解损失需要付出。然而,平行和反平行的皆有可能,主要是因为,平行取向中的 a-g' 相互作用和反平行取向中的相互作用在能量上是相似的。
( 3 ) Harbury 的组采用计算方法 [ 见 3.2.5.4 (4)],不仅考虑期望的结构,而且考虑不同的不期望的结构,以实现特异性 [39] 。改变了 GCN4 的中心七元重复的 a 位、d 位、e 位和 g 位残基(见注 15 );所有非脯氨酸残基以及同型和异型序列都经受了计算选择和实验验证。次于 g/e' 残基对的体积互补和电荷互补,发现 d 位的 Glu 宁愿与 e' 位的 Arg 配对。
3.2.2.3 边缘残基
配对特异性受到 e 位和 g 位残基静电本质的影响(在平行二聚螺旋中,一个七元重复的 g 位与另一个螺旋的下一个七元重复的 e' 位,被记为 i→i’+5 )。这些残基常常分别是 Glu 和 Lys。这样互补的残基对相互作用,分别增加并巩固原来由核心疏水作用提供的特异性和稳定性。盘绕螺旋外接触边缘的电荷模式会指导蛋白质是形成齐聚还是杂聚蛋白,以及盘绕螺旋内的取向是平行的还是反平行的。但是,PV 假定(见第 1 节;参考文献 [ 8 ] ) 过分地简单化;那些在复合物稳定性上很少有或没有作用的残基,通过指导螺旋避开,那些会危及分子的特异性的,同样的或不期望的相互作用来达到其目的(负设计)。另一方面,某些盘绕螺旋似乎没有经受到进化压力,因为它们已经是特异性的,并且也不需要比它们现在的状态更稳定。
( 1 ) 如所期待的,用排斥的 Glu-Gk 配对取代有利的 g/e' 位 Gin-Gin 配对已被证明使盘绕螺旋构象不稳定 [ 40]。
( 2 ) Hodges 及其同事估计 g/e' 配对盐桥对盘绕螺旋稳定性的贡献是 0.37 kcal/mol ( 见注 16;参考文献 [41])。
( 3 ) 细心 e 和 g 位电荷,可容许杂二聚体的生成,并另外保证,如 PV 假定所包含的,不倾向于生成齐二聚体[ 9,42,43] 。
( 4 ) 在 e 位和 g 位找到的 4 个最常见的氨基酸是 Glu、Gln、Arg 和 Lys。这些残基含有长疏水侧链,能够与 a 和 b 核心残基作用,并终止于一带电(Glu、Arg 或 Lys) 或极性(Gin) 基团。通过先突变 e,而后 g,最后两个七元重复对上的残基为 Ala,Krylov 等针对鸡的卵黄蛋白原结合蛋白成功地建立了这些相互接触残基的耦合能 ( 见注 17)。这一双突变热力学循环被用来为外沿残基接触的倾向建立热力学标度(表 3.4)。在 150 mmol 氯化钾和 pH 7.4 的条件下,Glu-Arg 吸引被证明比 Glu-Lys 吸引稍微稳定,合理的解释是,Arg 的侧链较长并较好地与谷氨酸相互作用,而且,各个甲基更有效地把核心与溶剂屏蔽开。这样的后果是增加带电末端基团的作用,在较弱的水性环境中产生较大的贡献。如所预期的,高盐像低 pH —样,弱化这些相互作用。在高盐或低 pH 条件下,极性作用减弱,疏水作用增强。Glu-Arg、Glu-Lys 和 Gin-Gin 相互作用是最具稳定能力的(与取向无关)。而 Glu-Glu、Arg-Arg、Arg-Lys、Lys-Arg 和 Lys-Lys 这些相同电荷的相互作用相当地不受欢迎。
( 5 ) Arndt 等设计了一个多肽库。此库的设计基于 Jim-Fos 杂二聚,库中 b、c 和 f 残基来自于各自的野生型蛋白,a 位和 d 位为 Val 和 Leu ( 带有 a3Asn 在核心的插入例外,此插入引导期望的螺旋取向和寡聚态),e 和 g 残基则用三核苷酸作改变以得到等摩尔的 Arg、Lys、Gin 和 Glu 混合物(见注 7;参考文献 [8])。出人预料的是,最好地选择出来的成功者-Winzip-A2B1 杂二聚体(见注 18),在 g/e' 位缺少完全互补的带电残基,尽管选择过程是很彻底的。更确切些说,6 个 g/e' 对的两个预测为排斥的,提示得到的序列偏离简单的电荷互补规则( PV 假设)。可以假定,整体静电势(包括分子内和分子间相互作用)起主要的作用,并且与核心残基的作用,如像有利的堆积或立体冲撞,也可以调节这些 g/e' 作用(见参考文献 [ 8 ] 和 [ 31 ] 及其中引用的文献 )。这样的观察与天然发生的盘绕螺旋相符,这些天然结构通常有复杂的相互作用模式。这些盘绕螺旋必须满足一些标准,如生物稳定性和在家族内的极高特异性,而与其他盘绕螺旋家族间没有交叉反应 [46]。
3.2.3 螺旋取向
盘绕螺旋多数折叠为平行排布,但是,越来越多的测定了结构的蛋白质含有反平行的盘绕螺旋结构域 [47] 。与反平行盘绕螺旋的生物学重要性逐渐得到承认相反,对这类分子的研究被没有行为规范的模型体系所牵制。例如,在像丝氨酰转移 RNA ( t RNA ) 合成酶或丁型肝炎抗原那样的蛋白质中发现的反平行盘绕螺旋,都被证明足以实现没有更进一步结合的二聚化。
Hodges 及其合作者第一个报道了全新设计的,被内部二硫键限定在反平行取向的盘绕螺旋的表征 [48] 。这一以及其他设计的反平行盘绕螺旋,分别比它们的有几乎等价的螺旋间相互作用的平行对应物更稳定 [49,50]。这些数据显示,假定其他一切都是等价的,螺旋偶极相互作用(见 3.2.4.3 ) 偏好反平行取向。
3.2.3.1 核心残基
在平行盘绕螺旋中,互相堆积的核心残基有 a-a' 和 d-d'。在反平行盘绕螺旋中有 a-d' 和 d-a' 中心堆积,产生同样的堆积层 [51]。
( 1 ) 已经证明,Ala 残基在全新设计的盘绕螺旋核心的相对位置可以控制平行或反平行取向 [ 见 3.2.1.1 ( 3 );参 考文献 [52] ] 。通过细心地放置 Ala 在中间的七元重复中,全平行的或全反平行的四聚体都可以形成。在分子中间核心位置的七元重复的中间两层平面用另一种不同的残基对 Ala 和 Leu (Ala- Leu- Ala- Leu) ,也可以达到同样目的。这样由大小两种残基交替组成的核心(Ala- Leu- Ala- Leu) 是引入小侧链的最好办法。在平行安排中,堆积会是在一个平面中都是 Ala,而另一个平面中都是 Leu,于是导致一个大空洞从而溶解核心并使分子不稳定( 见注 19)。
( 2 ) 在一个类似实验中,二聚的 GCN4-p1 ( 见注 2 ) 核心 Asn 被变为 Ala。结果是得到反平行三聚体,以避免核心空洞 [53] 。但是,在苯存在的条件下,得到的是平行三聚体,苯结合在核心空洞中。
( 3 ) 在最近称为 APH 的反平行同二聚盘绕螺旋的设计中,疏水核心中的 β 分支的立体匹配(lie 于 d 位)和截断的侧链(Ala 于对面的 a' 位)以及其他特性 [也见 3.2.3.3 (3)] —起被用来启动反平行取向。平行排布在 lie 的 d 层是能量上没有优势的,从而很差地被放在二聚盘绕螺旋中(见 3.2.1.1 ),和疏水核心的 Ala-Ala 空洞从能量上排除(见注 20)。
3.2.3.2 极性核心残基
与平行盘绕螺旋相似,与对应掩埋的极性残基也在规定螺旋取向上起到关键的作用。
( 1 ) 在平行盘绕螺旋中,普遍地观察到 a-a' 的 Asn 配对 ( 见 3.2.1.2 )。但是,在反平行盘绕螺旋中,对应的 a-d' 位并未观察到这种配对(综述见参考文献 [47])。确实,在反平行盘绕螺旋中的 Leu-Leu 相互作用比在平行的核心堆积中更稳定 [49],并且很可能是 Asn-Asn 相互作用和静电相互作用(见 3.2.2.3 和 3.2.3.3 ) 导致平行构象相对于反平行构象的特异性。
( 2 ) 尽管在天然蛋白中没有 Asn-Asn a-d' 配对,Oakley 和 Kim 修饰了平行杂二聚盘绕螺旋肽拉链,使得仅当螺旋在反平行取向时,才可以存在掩埋的极性相互作用, ( 即 a-d' 配对;参考文献 [56])。据估计,这一掩埋的极性相互作用给予约 2.3 kcal/mol 中等程度的反平行偏向(见注 21)。但是,仅在掩埋的极性相互作用与引进平行取向时电荷排斥两者结合时,才能排它性地形成反平行盘绕螺旋 [见3.2.3.3 (2)]。
( 3 ) 与在平行二聚盘绕螺旋中存在的 a-g' 或 d-e' 相互作用可以比较(见 3.2.2.2 ), a-e' 或 d-g' 相互作用可以出现在反平行盘绕螺旋中。例如,在丝氨基 tRNA 合成酶盘绕螺旋中,一条链上 d 位的 Arg-54 和另一条链上 g' 位 的 Glu-74 [ 57],或者在 GreA 盘绕螺旋中的 a-e' 相互作用。据假定,这种类型掩埋的极性相互作用也可能在取向特异性中起作用。Oakley 的小组取代了肽拉链的核心 Asn 残基对,以使得在反平行取向中,Acidpi 的 a 位 Arg可以与 Basepl 的 g' 位 Glu 作用(见注 22;参考文献 [59])。平行构象的稳定性会被潜在的 e' 位 Lys 的排斥作用降低。但是,与 Campbell 和 Lumb 的研究一致 [ 见 3.2.2.2 ( 2 ) 和注 14;参考文献 [38]],虽然核心引进 Arg 后能够促进二聚化,但并未发现对反平行或平行取向有明显的偏好。两种状态的自由能差估计仅有(0.1±0.1 ) kcal/mol。一个可能的解释是归因于与邻近的 g 位 Glu 形成了螺旋间相互作用。
3.2.3.3 边缘残基
在平行盘绕螺旋中,极性的 e 位和 g' 位产生有利的作用。在反平行的盘绕螺旋中,e 与 e' 作用,g 与 g' 作用,结果是一个螺旋被等效地旋转了 180°。这种倾向性的改变,在取向选择上有着重要作用。
( 1 ) Monem 等设计了平行的和反平行的盘绕螺旋,预计会有链间吸引或排斥 ( 见注 23; 参考文献 [49] )。确实发现,在主要的取向中有带相反电荷氨基酸间的静电相互作用。
( 2 ) Oakley 的小组改进了早先设计的反平行杂二聚盘绕螺旋 [见 3.2.3.2 (2)]。 在他们的第一个设计中 [56],在 e 位和 g 位,一条肽链仅含 Glu,另一条肽链仅含 Lys ( 见注 21)。在他们的新设计中,替换了每条肽链的 g 位残基,以使得所有潜在的吸引作用都预计只在反平行取向存在(见注 24;参考文献 [60])。相反,两个潜在的库仑排斥作用预期存在于平行取向中,并且确实证实了反平行排布的强烈向。
( 3 ) 在最近设计的反平行齐二聚盘绕螺旋 APH [ 也见 3.2.3.1 (3)],N 端 e 位和 g 位的 Glu 与 C 端 e 位和 g 位的 Lys 被用来引导反平行取向,结果在反平行排布得到 8 个潜在的库仑作用,在平行排布得到 8 个潜在的排斥作用(见注 20;参考文献 [55])。
3.2.4 稳定性
达成有利的稳定性是大量效果相反的焓和熵的净结果。结果是得到一个具中等程度稳定性的蛋白质,进化后可以在生理条件下与其伴侣蛋白相互作用,但不是稳定到不会解离的程度。达到这个平衡,是核心和边缘残基以及它们的相互作用、螺旋长度、成螺旋的倾向、溶解度和螺旋戴帽的结果。本节讨论这些稳定化因素。
一个重要而微妙的因素是溶解度。参与的螺旋必须有一非极性内核,以容许有利的相互作用,但螺旋的整体非极性必须不至于强到在工作条件下发生聚集。残基 a 和 d 必须形成一个连接两个螺旋的疏水带,e 和 g 典型地应该是极性残基,参与保证只有真正的结合伙伴与螺旋作用(即与非作用伙伴结合时变得不稳定),并增强核心导致的稳定性。这把剩下的残基留在了七元重复中的位置 b、c 和 f 上,以使电荷平衡和保证螺旋稳定且可溶。Glu 和 Lys,也有非常适合的螺旋倾向。带电残基也可与螺旋偶极有利地作用 ( 见 3.2.4.3 ),还可以与螺旋内一圈以外的带电残基有利地作用。这给予在离开二聚界面的地方,暴露于溶液的位点选择这些残基的额外优点。在溶液暴露位置插入 Tyr 有利于肽浓度测定。粗略地说,对原型的二聚盘绕螺旋,如 GCN4 和 Jun 蛋白,在这些位置Lys、Asp、Arg、Glu 和 Asn 有优势。虽不常见,但也存在的是 Ala,也许在附近空间的残基引起整体 α 螺旋倾向降低的情况下,可以认为它给螺旋以额外的稳定性。
3.2.4.1 螺旋长度
一般来说,在盘绕螺旋链长度增加时,观察到稳定性的(线性)增加 [61] 。这是因为盘绕螺旋的序列将会起到额外的重要作用。例如,Lau 和 Hodges 构建了一个比原肌球蛋白( 284 残基盘绕螺旋)还稳定的 29 聚体(见 注 25;参考文献 [ 62] )。在增加了的疏水掩埋、氢键以及极性相互作用的基础上,可以期待,当长度增加时, 盘绕螺旋结构变得更加稳定。在对设计的齐二聚肽的长度研究中(见注 26;参考文献 [63] ),这已被证明。虽然最短两个七元重复(见注 27;参考文献 [ 64 ] ) 也是需要的,在同三聚体的情况下容许结合。Lac 阻遏蛋白的盘绕螺旋结构域被用来作为检测链长对稳定和折叠的效应的基础 [ 65 ] 。毫不奇怪,四聚体的解离常数随每个螺旋 中七元重复数的增加而降低(见注 28 )。有些更令人惊奇的事实是,每个螺旋少到 4 个的七元重复协同地折叠,并没有二聚中间物的迹象。
与短盘绕螺旋相反,长的盘绕螺旋,如像原肌球蛋白和肌球蛋白重链结构域,并不在它们的核心排它性地富含大块的非极性氨基酸。更恰当地说,由于蛋白质长度所提供的稳定性,这样的蛋白质含有小的非极性或带电残基[ 66] 。这些残基约占到核心的 40%。这些不利于稳定的残基集团主要由 Ala 组成,因为这种残基比起极性残基来说对核心的稳定性损害较小(比极性侧链更容易堆积),并能增加整体的螺旋倾向性。这意味着,尽管获得正比于七元重复数的稳定性增加,但并未在这些长盘绕螺旋中观察到,从进化的观点来看,这样高的稳定性增加是不必要的。作为代替,疏水稳定的残基集团为盘绕螺旋提供必要的稳定性,而使稳定性降低的残基集团却不提供稳定性,但它们确实维持螺旋结构。这些主要含 Ala 的残基集团,在这些区域增加游变性和局部的去折叠,却不影响盘绕螺旋的整体稳定性,很可能允许蛋白质行使其独特的生物功能。
3.2.4.2 螺旋倾向
据 Litowski 和 Hodges 报道,通过把 Ser 改变为 Ala ( 具最高螺旋倾向性的氨基酸)来增加非核心残基的 a 螺旋倾向,可以稳定整个的盘绕螺旋 [ 67] 。在它们的模型----Glu/Lys 盘绕螺旋(见注 29 ) 中,这导致每个替换 0.4~0.5 kcal/mol 的稳定化。这与早先 O'Neil 和 DeGmdo 的结果相符 [68] 。这个数值小于对单个 a 螺旋的值,可能是因为维持盘绕螺旋涉及额外的稳定化相互作用。
一般来说,外部残基 b、c 和 f 应该与溶剂形成氢键,并且在同时,补偿潜在的不再能与之形成氢键的伙伴 [69] 。这些残基也负责帮助维持 α 螺旋倾向,其中每个残基都有一个构型偏好,或者稳定化或失稳化螺旋 [68] 。Ala 的 a 螺旋倾向已知是所有氨基酸中最高的,并且虽然所有普通的核心疏水残基(Asn 为例外)都有高的 a 螺旋倾向,溶液暴露的 Arg 和 Lys 也起一定的作用。这是因为 Lys 和 Arg 两者都是很好的氢键伙伴,并且非常适合用来改善分子的溶解度。确实,我们发现,螺旋倾向性在盘绕螺旋设计中是一 个重要的因素。 (http : //ww w. molbiotech. uni- freiburgode/bC IPA)。
3.2.4.3 与螺旋宏偶极的相互作用
蛋白质结构中 α 螺旋组成的统计分析揭示不同的氨基酸偏好螺旋的不同部位。特别地,带负电能力的残基(Asp 或 Glu ) 强烈地偏好接近螺旋的 N 端,而带正电能力的残基(His、Arg 或 Lys) 稍弱地偏好 C 端 [ 71,72] 。解释极性侧链对螺旋末端偏好的模型可以分为两类。第一,因为 α 螺旋的头 4 个主链 NH 基团和最后 4 个 CO 基团不能与其他的主链基团形成 i→i+4 主链氢键,螺旋末端的极性侧链则可以代为氢键伙伴。这称为螺旋戴帽并在3.2.4.4 节有描述。第二,带电侧链和由单个肽骨架偶极排列形成的 α 螺旋净偶极矩之间的静电“电荷-螺旋偶极”相互作用也可以使蛋白质稳定或失稳。
( 1 ) Hodges 研究组研究了带负电的 Glu 侧链,对一个设计的、没有螺旋内和螺旋间相互作用的、齐二聚盘绕螺旋稳定性的影响的位置效应(见注 30;参考文献 [73])。在盘绕螺旋的每一个链的近 N 端,一个取代 Gin 的 Glu 在 pH 7.0 使盘绕螺旋稳定,与电荷-螺旋偶极相互作用模型相符。相反,在螺旋中部用 Glu 替换会降低螺旋稳定性,因为在 pH 7.0 相比于 Gln,Glu 的螺旋倾向和疏水性更低。在 C 端的 Glu 被替换则更加降低盘绕螺旋的稳定性,这是因为本身带有的降稳定性能力,和与螺旋偶极矩的负极间不利的电荷-螺旋偶极相互作用的综合效果。
( 2 ) 在从两个在 4 个 a 位和 4 个 g 位含 Glu、Gin、Arg 和 Lys 残基等摩尔混合物的设计的蛋白质库中挑选杂二聚盘绕螺旋时(见注 7 ),Amdt 等观察到,在选出的盘绕螺旋序列中,带负电的 Glu 和中性的 Gin 在 N 端部分的富集,以及带正电的 Lys 和 Arg 在 C 端部分的富集。这种偏好与假设的电荷-螺旋偶极相互作用符合得很好。
3.2.4.4 螺旋戴帽
螺旋可以标记为 N'-Ncap-N1-N2-N3-N4-mid-C4-C3-C2-C1-Ccap-Cy。在这些位置中,N'、Neap、Ccap 和 C' 没有螺旋的平和中角,并且 N1-N2- N3···C3-C2-C1 参与作为 α 螺旋特征的 i→i+4 氢键。残基 N1、N2、N3、C1、C2 和 C3 是唯一的,因为它们参与 i→i+4 骨架 -骨架氢键的酰胺基只使用 CO 基(在 N 端)或者 NH 基(在 C 端) ( 见 3.2.4.3 )。这些残基对形成氢键在螺旋结构和稳定性上有强有力的影响「 74 ] 。从 N4 或 C4 往上,所有残基都可以满足 NH 和 OH 骨架氢键条件。
( 1 ) 在螺旋设计中,在 N 端对稳定性最具选择性的位置是 Neap 位。对这个位置 6 个最适合的残基是 Ser、Asp、Thr、Asn、Gly 和 Pro,另外有 11 个残基(Val、lie、Phe、Ala、Lys、Leu、Tyr、Arg、Glu、Met 和 Gin ) 被完全排除 [ 75 ] 。对 Neap 的 6 个最适残基中,Ser、Asp 和 Thr 是最好的。
( 2 ) Neap 模体的一个好例子是 Ser- Xaa- Xaa-Glu (Ncap- N 1- N 2- N 3 ) ,其中反向的侧链/主链相互作用样式( Neap 位 Ser 的 OH 与 Gki 的 NH,以及 Ghi 的羰基与 Ser 的 NH ) 使螺旋稳定。进一步的稳定可通过 Ser- Xaa- Xaa- Glu 模体前后的疏水残基达成 [76] 。Lu 等在 GCN4 的序列中引进了这一戴帽样式,因此而使盘绕螺旋达到 1.2 kcal/mol 的稳定水平(见注 31;参考文献 [77])。
( 3 ) N1 位 和 C' 位很喜欢 Pro ( 在立体化学上是相容的,因为前面的残基具有非螺旋的骨架两面角),这确实是一个共同的螺旋终极模体,但必须避免出现在螺旋主体中,以及 C3、C2 和 Ccap 位。作为所有氨基酸中溶解度最髙的 Pro 与螺旋末端的溶液暴露位是相容的 [78] ,并且不需要氢键受体,因为它没有骨架 NH 基团 [76] 。
( 4 ) C 端戴帽模体包含骨架-骨架氢键,而不是在 Neap 和 N3 之间观察到的侧链到骨架氢键。在 C 端骨架,氢键由螺旋后骨架基团来实现(如 Schellman 模体中的 C' 和随后的 C'';参考文献 [76])。这意味着,C 端只在 C' 位需选择可以取正$角的残基,如 Gly。
3.2.5 理性设计与选择技巧
蛋白质设计的复杂本性意味着设计或预选具有高稳定性的序列是一件令人畏缩的任务。如果程序允许,宁愿生成一个相互作用库—— 可检查其序列是否有成功的相互作用的不同分子的集合。这可认为是半理性的设计,凭此可在库中引进特定位点的平衡变化(经常维持野生型残基不变),得到的大量分子组合可供筛选。正常情况下,在类似的设计中,要改变所有七元位为所有可能的氨基酸,将会产生大而不现实的库容(如果含 4 个七元重复,每个位点有两种可供选择的氨基酸,将会产生 228 = 2.68 X 108 库成员)。但如果只需产生一条待合成并测定结合强度的序列,则会是耗时且枯燥的,而且结果常会是令人沮丧的。采用半理性设计,可得到合理的折中,一个分子可以包含在库中,测试它是否确实是一个用于结合的优秀候选者,同时,提供多功能以产生新的、 非直觉的、并常常是全新的结合伙伴。在基于细胞的系统中的选择,具有更多额外的优点,可以伴随地筛选出对该有机体内的蛋白酶敏感的序列。
3.2.5.1 简并密码子
使用简并密码子,可在希望改变的位点上编码若干氨基酸的混合密码。同样,在仔细选择要随机化的对应位点引入简并密码子,不仅可以引入期望的碱基,而且可以引人期望的氨基酸。如已经讨论过的,盘绕螺旋在不同位置对氨基酸类型有偏好。例如,e 和 g 残基常是极性且互补的(表 3. 4),因而,Glu-Lys 相互作用可以替换 Glu-Arg 相互作用,对分子结构只有极少扰动(因为 Lys 和 Arg 在体积与电荷上相当相似)。在这种情况下,Arg 可以引进,而 Lys 可以保留在库中,以观察从分子整体上看,哪个氨基酸更适合。同样地,疏水核心在a 位偏好 β 分支氨基酸,这意味着,虽然在野生型中可以期待找到 Val,lie 也许更合适。但是,必须注意到,执着于这些偏好则是过分简单的,表面上不利的残基对设计非特异结构和甚至整体稳定结构是必需的(见参考文献 [8])。但是,一般来说,保持整体的“两元样式”将能够保证得到所有的库中成员,有合理的机会形成盘绕螺旋结构,而不是能量上有利的其他结构。盘绕螺旋库成员将像野生型结构所做的那样,掩埋它们的疏水残基,并用极性的 e 和 g 残基将这些疏水残基包围起来。对一个盘绕螺旋来说,疏水核心的维持,称为 “ 3-4重复”(a 到 d 和 d 到 a 分别是 3 和 4 个残基间隔)是基本的。最后,可能合成特异的三核苷酸聚合物,使得到的基因序列编码,并只编码期望的最终氨基酸序列 [79] 。这也有助于在容许更多期望的待筛选的变化的同时,保持低库容。对使用正规的简并寡核苷酸的简并密码子,情况不是这样的。依赖于密码子用法表,可能意味着为了有两个期望的氨基酸,另一个不期望的氨基酸必须包含在那个位置(见 3.2.5.2 和图 3.2 )。也有可能,在密码子表相反两 端的两个氨基酸是期望的,但是在现实中,只能用这样预先合成的三核苷酸密码子才能包括进来。这样的三核苷酸建筑模块近来已商品化(Glen Reserch,Sterling, VA;Metkinen Oy,Finland)。
3.2.5.2 密码子偏向
密码子偏向是指一种而不是另外一种密码子将编码一个特定的氨基酸(图 3.2A )。例如,在大肠杆菌中,CGT 编码 Arg 的次数比 CGA 多 5 倍。很明显,当用包含编码库中多肽的基因的质粒转染细胞(如大肠杆菌)时,必须选用在宿主有机体中常用的三联体,而不是不常用的密码子,后者可能导致可读框移位 [ 80~82] 或库中代表性不好的序列。还有,在设计用于筛选的库的情况。例如,希望引进 β-分支氨基酸的所有组合到 a 位,但这取决于密码子的用法。图 3.2. 显示某些我们最喜好的密码子组合,用于盘绕螺旋的不同位置。大多数组合只包括少数选项以使库维持在合理的大小。通过检查图 3.3 ( 大肠杆菌密码子用法;对此或其他有机体见 www.kazusa.or.jp /condon) 我们见到,如果要盘绕螺旋的 a 位包括 Val、lie 和 Thr,需要密码子 GTN、ATH ( 如果 Met 必须避免)和 ACN。这会意味着在密码子的第一位需要 G 或 A,第二位需要 T 或 C,并且第三位需 要除 G 以外的任何其他核苷酸,因为 ATG 会编码 Met,导致简并的密码子 RYH ( 所有作为结果的密码子都是大肠杆菌经常使用的)。但是,对于 Val、lie 和 Thr 的组合,不可能排除库中不需要的氨基酸,因为上述核苷酸的混合也会包括编码 Ala 的 GCH。
另一个例子是,如果想包括氨基酸 Gin、Asn 和 Lys,则根据默认的编码,必须也包括 His。但通过合成只编码那些需要的氨基酸的三联核苷酸,这个问题是可以克服的 [ 31,79] 。另外,必须仔细排出表示得不好的密码子。例如,在表示 Arg 时就会遇到这种情况,因为在大肠杆菌中短缺 AGG 和 AGA 密码子的氨酰基 tRNA 合成酶。最后必须注意,如果一个位点在库中需要无偏向的表示,那么在那个位点上对所有氨基酸都应该选用 1 : 1 的比例(与代表它们的密码子一样)。在一个简并位上,某一个氨基酸比另一个氨基酸更多地表达,会自然地把对应于此差异的偏向引人体系中,因为那个氨基酸得到了更多的表达。
3.2.5.3 筛选系统
向盘绕螺旋开放的最常用筛选系统是蛋白质片段互补测试选择。在这个测试中,相互作用的蛋白质,如两个盘绕螺旋片段,被系在报告蛋白的两边上,仅当两个融合蛋白或多肽结合的时候报告蛋白才被激活。这已被用于二氢叶酸还原酶、泛素 [89] 、β-半乳糖苷酶 [ 90 ]、β-内酰胺酶 [ 91,92 」和绿色荧光蛋白 [93] 这样的胞内测试,有同时抗蛋白酶敏感或抗毒性多肽选择的额外优点。
用于盘绕螺旋的另一个筛选系统是酵母双杂交系统。在这个系统中,一个螺旋被融合于 Gal4p 转录因子的结合结构域(它与一个启动子结合),而另一个螺旋则融合于其活性结构域(它与聚合酶相互作用)。只有两个螺旋间的相互作用能够把两个嵌合蛋白拉到互相接近的位置并允许转录激活子起作用,并因而激活可以测试活性的报告基因 ( 如 β-半乳糖苷酶 ) 。使用这一系统,可从一蛋白质库中筛选到一个蛋白质或结构域的新的相互作用伙伴( 最新的述评,见参考文献 [94])。
λ 抑子系统,是基于通过用一杂寡聚化的结构域取代其 C 端结构域,使大肠杆菌 λ 阻抑子的活性重新恢复。当 C 端结构域与自身(同型相互作用)或来自另一个融合蛋白的不同的结构域(异型相互作用)形成二聚体(或更高的寡聚体)时,就探测到阻抑作用。或者通过模拟噬菌体感染免疫,或者通过检测对 β-半乳糖苷酶那样的报告子的阻抑,可以探测到功能阻抑子的存在 [ 95,96] 。
最后,通过噬菌体展示,蛋白质可以展示在丝状噬菌体的表面外壳蛋白上。从展示在噻菌体上的多肽库中可以挑选结合者通过几轮挑选来浓缩。这一技术也容许挑选与非天然化合物结合的蛋白质 [97]。
3.2.5.4 与设计有关的计算
某些研究组不使用体内选择系统,而是使用计算的方法得到盘绕螺旋的有希望的序列。本节讨论与此有关的问题。
( 1 ) Keating 等发展了一种计算方法,以预测疏水核心突变对相互作用特异性的效应 [98]。通过使用一种算法,综合范德华堆积作用能,溶剂化效应和 a 螺旋倾向性,来达到此目的。据此,可预测来自于核心堆积的伴随偏好。设计了核心 a 和 d 残基突变为 Leu、lie 和 Val 的盘绕螺旋,以产生 6 个不同稳定性的不同的杂二聚体(见注 32)。该算法可以预测稳定性,并与实验数据很符合。
( 2 ) Mayo 的小组使用设计的算法估算表面蛋白相互作用。他们检测了 3 个打分函数:氢键位能,与没有补偿的极性氢掩埋罚分相结合的氢键位能,氢键位能与螺旋倾向结合 [69] 。对这 3 个打分函数中的每一个,以 GCN4 - pl 为例(见注 2 ),用该算法找到优化的氨基酸序列,并合成相应的多肽。得到的所有多肽都是二聚的;在 1°C ,近 100% 是螺旋的;较之于具有随机分布的表面亲水残基的 GCN4 多肽的 15°C,熔融温度为 69~72°C。数据建议,在盘绕螺旋多肽表面残基的序列设计中,螺旋倾向性是关键因素。
( 3 ) 为了要生成具有右手超螺旋缠绕的盘绕螺旋,发展出了一种算法,即加入了对主链游变性的处理 [99] 。因为要用固定主链的话,一个已经存在的例子便可提供坐标定位,即使这样,这些数值对近同源调整后的序列可能并不适合。通过骨架的游变性,可从一小组主链构象中取样。这些取样然后再与侧链堆积取样相耦合。结果,以计算方法设计出了右手二聚的、三聚的以及四聚的盘绕螺旋(见注 33 )。疏水极性残基构成的样式规定蛋白质的整体折叠。寡聚态、主链构象以及侧链旋转异构通过计算,在不同的主链结构中找到最好的堆积来选择。得到的多肽正确地形成与设计目标一致的寡聚态,四聚体 X 射线结构与设计的结构在原子细节上相符。
( 4 ) Harbury 的一篇文章结合了正向(期望的结构)和负向(远离不期望的其他结构)设计,以优化相互作用的特异性 [ 见3.2.2.2 ( 3 ) ; 参考文献 [39]]。 GCN4 中心七元重复的 a 位、d 位、e 位和 g 位改变为所有非脯氨酸残基,以产生大约 8 X 109 个可能的序列(见注 15)。该算法类似于计算的双突变循环,其中的多肽是序列优化的, 而不是结构优化的。考虑过的能量竞争态有:
a. 折叠齐二聚期望结构;
b. 能量上有利的杂二聚体;
c. 未折叠的能量不稳态;
d. 难溶聚集态。
对于候选序列,这 4 种竞争态中的每一种都计算了自由能。这种所谓的“多态”设计比单态设计体系有一个优点,后者只寻找目标的最低自由能。不像这些设计,多态设计的结构常常偏离 PV 假定,并且同时,考虑到一些因素,如引起聚集的过多的疏水暴露和降低稳定性的过多的极性掩埋。更适当地,这种设计考虑了所有这些因素,当这些竞争的力支配对目标态的选择时,这种设计才需要改变。因而,选择是稳定性和特异性间平衡的结果,而不仅仅是目标稳定性。
来源:丁香实验