转贴:原核表达常见问题
丁香园论坛
2251
原核表达常见问题解答
2004-2-25
原核表达研究者关心的10个问题
pET系统是目前应用最为广泛的原核表达系统,已经成功地在大肠杆菌中表达了各种各样的异源蛋白。经过与使用过和正在使用这个系统的科学家的交流,我们发现了一些在使用pET系统的过程中以及原核表达中的一些常见问题。在此,我们选取了其中一些比较有代表性的问题,附上我们的建议改进方案,并期待和你一起分享成功的喜悦。
1.目的蛋白总是以不可溶的形式出现真是令人烦恼
在大肠杆菌中表达的异源蛋白经常发生错误的折叠,并聚集成为包涵体。经过诱导,目的蛋白通常可达细胞总蛋白的50%以上。虽然有一定比例的蛋白以可溶的单体形式存在,而多达95%(甚至更多)的蛋白则在包涵体中。实践中,有很多实验室采取降低诱导温度,例如 25–30°C (Burton et al. (1991)Prot.Exp. Purif.2, 432-441),或降低IPTG浓度(0.01–0.1mM)并延长诱导 时间,还 有采用特别的培养基 (Blackwell and Horgan (1991) FEBS Lett. 295, 10-12)等方法获得更多的可溶蛋白。随着越来越多的蛋白折叠途径被阐明,相信会出现更多有效的增加可溶性目的蛋白的实验方法。然而,让目的蛋白以包涵体形式聚集也并非总是坏事。不溶态在某些情况下非常有利:
a. 形成包涵体是目的蛋白表达量很高的表现。
b. 作为初步分离,将目的蛋白的包涵体纯化出来非常简便。用核酸酶处理,并经简单洗涤,通常可以获得纯度达75–95%的目的蛋白。
c. 存在于包涵体中的目的蛋白通常可以免于蛋白酶的水解破坏作用。纯化的包涵体可以用多种方法重新溶解,以便进一步进行纯化和重折叠操作。如果目的蛋白是用于制备抗原,经PBS悬浮和适当的佐剂乳化处理后,就可以直接用于注射了(参见 Fischer et al 1992) Science 257, 1392-1395)。如果目的蛋白融 合了His?Tag?序列,则可以在变性条件下用His?Bind?树脂亲和纯化。经纯化的蛋白用变性条件从树脂洗脱,再行重折叠。溶解和重折叠常常要用到离液剂、助溶剂和去污剂等(Marston and Hartley 1990) Meth. Enzymol. 182, 264-276)。研究者采用下述方法加强蛋白重折叠的效果,并在很多蛋白上取得了好结果,可以尝试以下:当蛋白还结合在树脂上时,使用6M–0M梯度盐酸胍、1mM还原型及0.2mM氧化型谷胱甘肽处理,继而用咪唑正常洗脱。有些实验室在透析去除变性剂的过程中加入底物或类似物,也有帮助酶折叠的效果(Zhi et al. (1992)Prot. Sci 1, 522-529; Taylor et al. (1992)Prot. Engin 5, 455-459)。
2.是否所有的位点特异性蛋白酶都有一样的酶切特性,而仅仅只是识别位点有所不同呢?
位点特异性蛋白酶(例如凝血酶、肠激酶和Xa因子)通常被用来切割融合蛋白。这些酶的活性和第二点酶切倾向性很不相同。凝血酶在这三种中是特异性活性最高的,能够有效切质量比仅为1:2000的蛋白。Xa因子似乎对于切点周围的序列很敏感,经常会出现特异性位点切割不理想却发生别的位点被切割的情况。肠激酶的专一性是上述三种中最好的,但由于切割效率低(通常要求质量比达到1:10)而显得比较昂贵。另一个需要考虑的问题是:切割完成之后,是否需要去除蛋白酶。在质量比比较高的酶切反应进行完后,通常要通过色谱法处理。比较方便可行的方法是采用生物素化凝血酶(货号69672)结合链亲和素琼脂糖(货号69203)一起使用。尽管没有一种蛋白酶完美无缺,凝血酶还算的上是活性高、专一性好的典型。
3.必须去除融合多肽或蛋白才能使目的蛋白获得活性吗?
大多数情况下目的蛋白带有His-Tag,NUS-Tag,11个氨基酸的T7?Tag?或HSV?Tag? 等小肽时仍能表现出完全的活性。这些肽段相对都较为亲水,而理论上这样不会干扰蛋白的三维结构。我们建议首先测试蛋白活性,再看是否一定要去除前导序列才能适合特定的应用要求。
4. 如果目的蛋白包含信号序列,它会不会被运至细胞周质并以可溶、活性形式存在?抑或目的蛋白甚至可以被分泌到生长培养基中?
N-端如果带有ompT 或 pelB 这样的前导序列是使目的蛋白进入细胞周质的必要非充分条件。如果在生长培养基中发现目的蛋白的话,多半是因为细胞壁收到破坏,而并不代表蛋白是被分泌到培养基里的(Stader and Silhavy (1990) Meth. Enzymol. 185, 166-187)。穿过大肠杆菌内膜的机制还不甚了了(综述见Wickner et al. (1991) Ann. Rev. Biochem.60, 101-124)。已经清楚了蛋白的成熟区对转运也有影响。虽然根据紧跟在信号肽序列后的目的蛋白序列可以对其输出的可能作个大概判断;但是由于蛋白的输出效率依赖于目的蛋白的特性,还是不能仅仅根据其序列来预测输出的实际情况(Boyd and Beckwith (1990) Cell 62, 1031-1033; Yamane and Mizushima (1988) J. Biol.Chem. 263, 19690-19696)。因此,实验中,在细胞质中发现目的蛋白(仍然带着未被切除的信号序列)或在细胞周质中有被部分加工的蛋白, 在细胞周质及其它区域发现经过其它加工的蛋白,都 不足为奇。某些情况下,降低诱导时的培养温度至25–30°C,可能提高输出蛋白的比率。
5. 如果我的蛋白大于100kd或含有多个亚基,还能用细菌表达吗?
在细菌中已经非常成功底表达了很多大蛋白(Aukhil et al. 1993)
J.Biol. Chem.268, 2542-2553)。多亚基复合物则可以通过分别表达各亚基,然后在有尿素的溶液中,将各组分以适当比例混和,再透析去除变性剂(Young et al. (1994) Cell 76, 39-50; Garboczi et al. (1992) Proc. Natl. Acad.Sci. USA 89, 3429-3433)。但是,自从Novagen的pETDuet和pACYDuet多表达载体被开发出来后,同时表达2-8个蛋白(亚基)变得十分容易了。
6. 我的基因对大肠杆菌有毒吗?
某个蛋白不是所谓 “毒素” 并不意味它就不会杀死大肠杆菌或显著降低其生长水平。虽然有些种类的蛋白由于显而易见的原因很容易被认为是毒素(例如,可以与DNA或干扰电子转移); 而其它的蛋白 (例如一些重组抗体)有毒则并不明显或不易预 期。如果试图在一个有“渗漏”表达的系统中克隆和表达蛋白而遭遇失败,基本可以认为目的蛋白对大肠杆菌有毒性。因此,对于一种新的基因的研究,基本的原则之一即是尝试多种pET载体/宿主菌组合,以期掌握最佳表达途径。
7. 如果IPTG诱导后细胞停止了生长,是不是表示细胞死了?
T7 RNA聚合酶非常活跃,T7转录和翻译信号极强,因此,一旦诱导,细胞的主要生理活动都向着目的蛋白表达的方面转化。在通常情况下,细胞将停止生长,形成克隆的能力大大降低,但并未死亡。菌落形成试验可以用来检测表达系统的性能。也有一些例外情况,例如特别的目的基因以及一些极为严紧的载体/宿主菌组合 (比如含有pLysE的宿主菌)等,这时在诱导后菌落还是会继续生长。
8. E. coli会去除成熟蛋白N-端的甲硫氨酸吗?这种加工对目的蛋白的稳定性有何影响?
N-端fMet是否被去除受倒数第二个氨基酸影响。这个加工过程由甲硫氨酸氨基肽酶催化,并受关系支配:去除的困难程度随倒数第二位氨基酸的支链大小的增加而降低(Hirel et al (1989)
Proc. Natl. Acad. Sci. USA 86, 8247-8251; Lathrop, B.K. et al. (1992) Prot. Exp. Purif.3, 512-517)。上述研究者在实验中发现以下氨基酸种类出现在倒数第二的位置上时,此加工过程极少发生或根本没有发生:His, Gln, Glu, Phe, Met, Lys, Tyr, Trp, Arg。而当倒数第二位上是其它种类的氨基酸时,加工过程发生的可能从16%到97%,Tobias等人(Science 254, 1374-1377,
1991) 确定了在大肠杆菌中蛋白氨基末端氨基酸与其稳定性之间的关系,也即“N-端原则”。具他们报导:如果下列氨基酸位于氨基端时蛋白的半衰期仅为2分钟:Arg, Lys, Phe, Leu, Trp和Tyr。相反,其它氨基酸位于氨基端时可以使受检蛋白的半衰期长达10小时以上。综上两条研究可以得出结论:Leu在氨基末端时很容易因为fMet被去除而暴露出来,从而导致蛋白的迅速水解。显然,当采用pET载体上的 Nco I 或 Nde I位点表达非融合蛋白时,完全不必担心Leu的密码子出现在倒数第二的位置上。
9. 除了毒性和降解,还有些什么因素会影响目的蛋白的表达水平?
a.) mRNA转录子中的二级结构会干扰AUG翻译起始密码子和/或核糖体结合位点(Tessier et al. (1984) Nucl.Acids Res. 12, 7663-7675; Looman et al.(1986) Nucl. Acids Res. 14, 5481-5496; Lee
(1987) Gene 58, 77-86)。所有pET载体的转录产物都是下列两种之一:
rbs Nde I/Nco I
5'...AAGAAGGAGAUAUACAUAUG...3'
5'...AAGAAGGAGAUAUACCAUGG...3'
如果发现表达很差,你可以通过检查编码插入序列的链上的与上述序列互补的序列,
(5'-CATATGTATATCTCCTTCTT-3'或
5'-CCATGGTATATCTCCTTCTT-3')
以确定是否是因为存在潜在的二级结构造成麻烦。
b.) 目的基因中稀有密码子比较多也是常见的表达水平低的原因(Zhang et al. (1991)Gene 105, 61-72; Sorensen et al. (1989) J.Mol. Biol. 207, 365-377)。如果稀有密码子集中出现在氨基端情况更为严重(Chen and Inouye (1990) Nucl. Acids Res. 18, 1465-
1473)。应该注意,跟据现有对大肠杆菌高表达的基因研究发现的有限的稀有密码子,已经观察到由于其对应的tRNAs水平很低,直接导致了翻译延伸的困难(Ikemura (1985)
Mol. Biol. Evol. 2, 13-34)。
c.) 序列中的意外的终止密码子可能造成突变,这在PCR克隆产物的情况下较为突出。可以通过测序发现此类问题,也可以用体外翻译的方法确认重组子的表达能力,可以选用Novagen的Red Nova? 溶菌液进行测试。
10. 有时除了我的全长目的蛋白以外,还能看到截短的产物,这是怎么回事?
一个最直接原因就是蛋白水解了。然而第二点翻译起始也非常有可能(Preibisch et al. (1988) Gene 72, 179-186; Halling and Smith (1985) Bio/Technology 3, 715-720)。起始密码子AUG (Met) 的上游在RNA编码区有类似于核糖体结合位点序列(AAGGAGG)的间隔序列(通常是5–13个核苷酸)时,容易出现这种问题。截短蛋白在纯化全长蛋白的操作时往往造成麻烦。解决途径之一即是选用两端都带有融合标签的pET载体,例如pET-28和pET-30系列载体在N-端和C-端都有His?Tag?。这样,全长蛋白就可以通过提高咪唑浓度,在洗脱时将截短蛋白与全长蛋白区分开。pET-29和pET-30系列载体在N-端融合有S?Tag?序列而C-有His?Tag,因此可以先后用固定化S-蛋白和His?Bind? 树脂亲和纯化以获取全长蛋白(Kim and Raines(1994) Anal. Biochem 219, 165-166)。
2004-2-25
原核表达研究者关心的10个问题
pET系统是目前应用最为广泛的原核表达系统,已经成功地在大肠杆菌中表达了各种各样的异源蛋白。经过与使用过和正在使用这个系统的科学家的交流,我们发现了一些在使用pET系统的过程中以及原核表达中的一些常见问题。在此,我们选取了其中一些比较有代表性的问题,附上我们的建议改进方案,并期待和你一起分享成功的喜悦。
1.目的蛋白总是以不可溶的形式出现真是令人烦恼
在大肠杆菌中表达的异源蛋白经常发生错误的折叠,并聚集成为包涵体。经过诱导,目的蛋白通常可达细胞总蛋白的50%以上。虽然有一定比例的蛋白以可溶的单体形式存在,而多达95%(甚至更多)的蛋白则在包涵体中。实践中,有很多实验室采取降低诱导温度,例如 25–30°C (Burton et al. (1991)Prot.Exp. Purif.2, 432-441),或降低IPTG浓度(0.01–0.1mM)并延长诱导 时间,还 有采用特别的培养基 (Blackwell and Horgan (1991) FEBS Lett. 295, 10-12)等方法获得更多的可溶蛋白。随着越来越多的蛋白折叠途径被阐明,相信会出现更多有效的增加可溶性目的蛋白的实验方法。然而,让目的蛋白以包涵体形式聚集也并非总是坏事。不溶态在某些情况下非常有利:
a. 形成包涵体是目的蛋白表达量很高的表现。
b. 作为初步分离,将目的蛋白的包涵体纯化出来非常简便。用核酸酶处理,并经简单洗涤,通常可以获得纯度达75–95%的目的蛋白。
c. 存在于包涵体中的目的蛋白通常可以免于蛋白酶的水解破坏作用。纯化的包涵体可以用多种方法重新溶解,以便进一步进行纯化和重折叠操作。如果目的蛋白是用于制备抗原,经PBS悬浮和适当的佐剂乳化处理后,就可以直接用于注射了(参见 Fischer et al 1992) Science 257, 1392-1395)。如果目的蛋白融 合了His?Tag?序列,则可以在变性条件下用His?Bind?树脂亲和纯化。经纯化的蛋白用变性条件从树脂洗脱,再行重折叠。溶解和重折叠常常要用到离液剂、助溶剂和去污剂等(Marston and Hartley 1990) Meth. Enzymol. 182, 264-276)。研究者采用下述方法加强蛋白重折叠的效果,并在很多蛋白上取得了好结果,可以尝试以下:当蛋白还结合在树脂上时,使用6M–0M梯度盐酸胍、1mM还原型及0.2mM氧化型谷胱甘肽处理,继而用咪唑正常洗脱。有些实验室在透析去除变性剂的过程中加入底物或类似物,也有帮助酶折叠的效果(Zhi et al. (1992)Prot. Sci 1, 522-529; Taylor et al. (1992)Prot. Engin 5, 455-459)。
2.是否所有的位点特异性蛋白酶都有一样的酶切特性,而仅仅只是识别位点有所不同呢?
位点特异性蛋白酶(例如凝血酶、肠激酶和Xa因子)通常被用来切割融合蛋白。这些酶的活性和第二点酶切倾向性很不相同。凝血酶在这三种中是特异性活性最高的,能够有效切质量比仅为1:2000的蛋白。Xa因子似乎对于切点周围的序列很敏感,经常会出现特异性位点切割不理想却发生别的位点被切割的情况。肠激酶的专一性是上述三种中最好的,但由于切割效率低(通常要求质量比达到1:10)而显得比较昂贵。另一个需要考虑的问题是:切割完成之后,是否需要去除蛋白酶。在质量比比较高的酶切反应进行完后,通常要通过色谱法处理。比较方便可行的方法是采用生物素化凝血酶(货号69672)结合链亲和素琼脂糖(货号69203)一起使用。尽管没有一种蛋白酶完美无缺,凝血酶还算的上是活性高、专一性好的典型。
3.必须去除融合多肽或蛋白才能使目的蛋白获得活性吗?
大多数情况下目的蛋白带有His-Tag,NUS-Tag,11个氨基酸的T7?Tag?或HSV?Tag? 等小肽时仍能表现出完全的活性。这些肽段相对都较为亲水,而理论上这样不会干扰蛋白的三维结构。我们建议首先测试蛋白活性,再看是否一定要去除前导序列才能适合特定的应用要求。
4. 如果目的蛋白包含信号序列,它会不会被运至细胞周质并以可溶、活性形式存在?抑或目的蛋白甚至可以被分泌到生长培养基中?
N-端如果带有ompT 或 pelB 这样的前导序列是使目的蛋白进入细胞周质的必要非充分条件。如果在生长培养基中发现目的蛋白的话,多半是因为细胞壁收到破坏,而并不代表蛋白是被分泌到培养基里的(Stader and Silhavy (1990) Meth. Enzymol. 185, 166-187)。穿过大肠杆菌内膜的机制还不甚了了(综述见Wickner et al. (1991) Ann. Rev. Biochem.60, 101-124)。已经清楚了蛋白的成熟区对转运也有影响。虽然根据紧跟在信号肽序列后的目的蛋白序列可以对其输出的可能作个大概判断;但是由于蛋白的输出效率依赖于目的蛋白的特性,还是不能仅仅根据其序列来预测输出的实际情况(Boyd and Beckwith (1990) Cell 62, 1031-1033; Yamane and Mizushima (1988) J. Biol.Chem. 263, 19690-19696)。因此,实验中,在细胞质中发现目的蛋白(仍然带着未被切除的信号序列)或在细胞周质中有被部分加工的蛋白, 在细胞周质及其它区域发现经过其它加工的蛋白,都 不足为奇。某些情况下,降低诱导时的培养温度至25–30°C,可能提高输出蛋白的比率。
5. 如果我的蛋白大于100kd或含有多个亚基,还能用细菌表达吗?
在细菌中已经非常成功底表达了很多大蛋白(Aukhil et al. 1993)
J.Biol. Chem.268, 2542-2553)。多亚基复合物则可以通过分别表达各亚基,然后在有尿素的溶液中,将各组分以适当比例混和,再透析去除变性剂(Young et al. (1994) Cell 76, 39-50; Garboczi et al. (1992) Proc. Natl. Acad.Sci. USA 89, 3429-3433)。但是,自从Novagen的pETDuet和pACYDuet多表达载体被开发出来后,同时表达2-8个蛋白(亚基)变得十分容易了。
6. 我的基因对大肠杆菌有毒吗?
某个蛋白不是所谓 “毒素” 并不意味它就不会杀死大肠杆菌或显著降低其生长水平。虽然有些种类的蛋白由于显而易见的原因很容易被认为是毒素(例如,可以与DNA或干扰电子转移); 而其它的蛋白 (例如一些重组抗体)有毒则并不明显或不易预 期。如果试图在一个有“渗漏”表达的系统中克隆和表达蛋白而遭遇失败,基本可以认为目的蛋白对大肠杆菌有毒性。因此,对于一种新的基因的研究,基本的原则之一即是尝试多种pET载体/宿主菌组合,以期掌握最佳表达途径。
7. 如果IPTG诱导后细胞停止了生长,是不是表示细胞死了?
T7 RNA聚合酶非常活跃,T7转录和翻译信号极强,因此,一旦诱导,细胞的主要生理活动都向着目的蛋白表达的方面转化。在通常情况下,细胞将停止生长,形成克隆的能力大大降低,但并未死亡。菌落形成试验可以用来检测表达系统的性能。也有一些例外情况,例如特别的目的基因以及一些极为严紧的载体/宿主菌组合 (比如含有pLysE的宿主菌)等,这时在诱导后菌落还是会继续生长。
8. E. coli会去除成熟蛋白N-端的甲硫氨酸吗?这种加工对目的蛋白的稳定性有何影响?
N-端fMet是否被去除受倒数第二个氨基酸影响。这个加工过程由甲硫氨酸氨基肽酶催化,并受关系支配:去除的困难程度随倒数第二位氨基酸的支链大小的增加而降低(Hirel et al (1989)
Proc. Natl. Acad. Sci. USA 86, 8247-8251; Lathrop, B.K. et al. (1992) Prot. Exp. Purif.3, 512-517)。上述研究者在实验中发现以下氨基酸种类出现在倒数第二的位置上时,此加工过程极少发生或根本没有发生:His, Gln, Glu, Phe, Met, Lys, Tyr, Trp, Arg。而当倒数第二位上是其它种类的氨基酸时,加工过程发生的可能从16%到97%,Tobias等人(Science 254, 1374-1377,
1991) 确定了在大肠杆菌中蛋白氨基末端氨基酸与其稳定性之间的关系,也即“N-端原则”。具他们报导:如果下列氨基酸位于氨基端时蛋白的半衰期仅为2分钟:Arg, Lys, Phe, Leu, Trp和Tyr。相反,其它氨基酸位于氨基端时可以使受检蛋白的半衰期长达10小时以上。综上两条研究可以得出结论:Leu在氨基末端时很容易因为fMet被去除而暴露出来,从而导致蛋白的迅速水解。显然,当采用pET载体上的 Nco I 或 Nde I位点表达非融合蛋白时,完全不必担心Leu的密码子出现在倒数第二的位置上。
9. 除了毒性和降解,还有些什么因素会影响目的蛋白的表达水平?
a.) mRNA转录子中的二级结构会干扰AUG翻译起始密码子和/或核糖体结合位点(Tessier et al. (1984) Nucl.Acids Res. 12, 7663-7675; Looman et al.(1986) Nucl. Acids Res. 14, 5481-5496; Lee
(1987) Gene 58, 77-86)。所有pET载体的转录产物都是下列两种之一:
rbs Nde I/Nco I
5'...AAGAAGGAGAUAUACAUAUG...3'
5'...AAGAAGGAGAUAUACCAUGG...3'
如果发现表达很差,你可以通过检查编码插入序列的链上的与上述序列互补的序列,
(5'-CATATGTATATCTCCTTCTT-3'或
5'-CCATGGTATATCTCCTTCTT-3')
以确定是否是因为存在潜在的二级结构造成麻烦。
b.) 目的基因中稀有密码子比较多也是常见的表达水平低的原因(Zhang et al. (1991)Gene 105, 61-72; Sorensen et al. (1989) J.Mol. Biol. 207, 365-377)。如果稀有密码子集中出现在氨基端情况更为严重(Chen and Inouye (1990) Nucl. Acids Res. 18, 1465-
1473)。应该注意,跟据现有对大肠杆菌高表达的基因研究发现的有限的稀有密码子,已经观察到由于其对应的tRNAs水平很低,直接导致了翻译延伸的困难(Ikemura (1985)
Mol. Biol. Evol. 2, 13-34)。
c.) 序列中的意外的终止密码子可能造成突变,这在PCR克隆产物的情况下较为突出。可以通过测序发现此类问题,也可以用体外翻译的方法确认重组子的表达能力,可以选用Novagen的Red Nova? 溶菌液进行测试。
10. 有时除了我的全长目的蛋白以外,还能看到截短的产物,这是怎么回事?
一个最直接原因就是蛋白水解了。然而第二点翻译起始也非常有可能(Preibisch et al. (1988) Gene 72, 179-186; Halling and Smith (1985) Bio/Technology 3, 715-720)。起始密码子AUG (Met) 的上游在RNA编码区有类似于核糖体结合位点序列(AAGGAGG)的间隔序列(通常是5–13个核苷酸)时,容易出现这种问题。截短蛋白在纯化全长蛋白的操作时往往造成麻烦。解决途径之一即是选用两端都带有融合标签的pET载体,例如pET-28和pET-30系列载体在N-端和C-端都有His?Tag?。这样,全长蛋白就可以通过提高咪唑浓度,在洗脱时将截短蛋白与全长蛋白区分开。pET-29和pET-30系列载体在N-端融合有S?Tag?序列而C-有His?Tag,因此可以先后用固定化S-蛋白和His?Bind? 树脂亲和纯化以获取全长蛋白(Kim and Raines(1994) Anal. Biochem 219, 165-166)。