蛋白纯化策略
互联网
(六)兴风作浪的乳糖(lactose)
晚上每天都有人做报告,我觉得让我收获最大的是Bill Studier的报告。本来这个报告是后来才听到的,但是由于Burgess的模块是唯一的涉及大肠杆菌钟表达蛋白的,我把这一段提前来说说。Studier这老哥是Brookhaven National Laboratory的,一生研究T7 噬菌体,也是T7 RNA polymerase induction system(pET 系列质粒)的发明者。
T7 系统在大肠杆菌表达蛋白的应用实在太广泛了,但凡表达蛋白的兄弟姐妹们的不可能不知道这个系统。长话短说,pET系列的质粒都用T7 promoter来控制基因的表达。T7 promoter只能被T7 RNA polymerase 识别,而这个咚咚大肠杆菌是没有的。但是有一些溶原菌株,染色体里面已经整合入了由LacUV promoter和lac operon控制的T7 RNA polymerase 基因片断。如果在细菌培养基里面加入IPTG, 来诱导T7 RNA polymerase 的表达,就可以启动目的蛋白的表达。这个系统非常强大,原因
在于T7 RNA polymerase工作起来非常有效率,效率高到什么地步呢?就是表达一个蛋白,表达量可以占到大肠杆菌总蛋白量的50%! 大家可以想象,这种系统虽然很强大,但是表达量太大,对大肠杆菌有毒性,造成的结果就是大肠杆菌十分排斥表达蛋白的质粒。
这一点我深有体会。我曾经想用细菌表达一个蛋白,而且估计这个蛋白会形成包涵体。妖怪的是,用质粒转化蛋白表达菌株BL21(DE3)怎么也不能转化,铺的板一个菌落也没有。我当时就怀疑是因为表达的蛋白对大肠杆菌有毒性,仅仅是本底的一点表达就足以杀死细菌。我来来回回一共转化了五六次,最后终于找到了唯一的一个菌落。虽然当时我怀疑过本底表达是罪魁祸首,但是我没有仔细想过本底是怎么
来的。
这个问题到了bill studier做报告之后,才真相大白。原来我们一般用的LB broth有三种成分,其中一种是tryptone. Tryptone是caseine的酶解产物,而casein又是milk里提取而来。由于milk 有乳糖(lactose),tryptone里面也有乳糖的污染。Bill studier研究发现即使很微量的lactose也能有效的诱导蛋白表达。原来如此!!!
所以要解决我原来的那个问题,用一种不含有乳糖的media做培养板就完事了。有意思的是,细菌有一种很有意思的特点,如果培养基里有足量的glucose,细菌会优先摄取glucose,而不能摄取lactose。Bill studier根据这个特点研究出一种可以自动诱导的培养基。这种培养基含有成比例的glucose 和 lactose。细菌首先摄取glucose,不摄取lactose,当细菌长到一定密度,耗完glucose之后,就开始摄取lactose,从而开始诱导表达。所以用这种培养基养菌,很省事,接种了第二天收细菌,提蛋白就行了。
最后Bill studier老爷子特别强调的是细菌的供氧。氧气是限制细菌生长最重要的瓶颈, 如果有足够氧气在培养基里面, 大肠杆菌的密度可以从一般的OD600 2~3 翻十倍到20~30!要提高培养瓶的供氧,可以用baffled flask。这种flask的瓶底边缘有几处凹陷(类似于可乐塑料瓶底那样的形状),能有效增加空气培养基的混合。
最后,详细内容可以见下列文献:
Protein Expression and purification 41: 207-234 (2005)
(七)古怪的CDC6
这里再给大家讲一个在大肠杆菌中表达蛋白质的例子,一个很夸张的例子,但是很有启发性。
Bruce Stillman 是冷泉港的现任主管,是一个绝对的牛人。不但科学做得很好,而且还很爱国。他是澳洲人,在美国待了N年,却从没有加入美国国籍,所以他只是外籍院士。我们的晚间报告有一个是他作的。他主要研究真核生物的DNA复制。这是一个到现在为止都没有完全弄明白的领域。在报告里面,他特别提到了表达纯化CDC6蛋白的经历,我觉得十分有意思。这个蛋白, 用他的话说,是\"a pain in the ass\"。
CDC6是干什么的呢?这要从ORC说起。真核生物的DNA有多个复制起始位点 (replication origin),ORC(Origin Replication Complex)是一个很大的蛋白复合体,可以识别这些复制起始位点。ORC在整个细胞周期里面都是与DNA结合的。在G1期里面,CDC6这个蛋白会与ORC结合,同时让MCM(DNA解旋酶)也装载到ORC上,形成一个prereplication protein complex。这个complex一旦形成,DNA 复制的准备工作就完成,只等其他kinase的激活,细胞从G1进入S期,复制就开始。
Stillman 实验室一直想表达酵母的CDC6和ORC的重组蛋白,然后做结构研究。但是到了CDC6,他们碰到了大麻烦。首先他们尝试真核系统来表达,但是意外的是,他们发现表达出来的CDC6完全没有活性。然后他们尝试用大肠杆菌来表达。首先发现37度诱导表达出来的蛋白不溶,重折叠也没有用。然后他们尝试在室温下诱导表达,发现蛋白虽然可溶了,但是都被降解了。然后呢,他们就想到了加一个GST tag,这下好了,蛋白也可溶了,也不被降解了,但是还是没有活性。他们估计是因为GST可以形成dimer,干扰CDC6的正常功能。所以呢,他们重新做了一个construct,在GST和CDC6序列中间加了一个蛋白酶切割位点。正当他们满心欢喜的以为问题解决了的时候,意外又出现了。有GST的CDC6是可溶的,可是一旦把GST切掉了,CDC就沉淀出来了....@#%#^&%$^#!!!
几乎是山穷水尽了,但是做这个project的博士后还是没有放弃希望,他做了最后的孤注一掷。他猜到这个蛋白可能很不稳定,对缓冲液要求可能很高,所以他让一个本科生连续试了十多种buffer,最后发现如果用磷酸钾+谷氨酸钾缓冲液,切掉GST之后CDC6就不会沉淀了。Stillman认为谷氨酸根和磷酸根跟氯离子相比更接近与核酸, 可能让CDC6更稳定。这个CDC6一共花了他们18个月时间, 却就这一点小trick!
这以后,他们表达的CDC6都有活性了,后来做了一系列的电镜三维结构重构实验,研究CDC6和ORC的复合体结构。Stillman实验室正在准备一篇文章要投到nature上去。大家等着看把。
(八)”液体DEAE“
绕了这么大一圈,现在再回到第一个模块的实验来。前面提到Dr.Burgess要我们
试Gudn HCl溶解sigma32之后的重折叠,结果很糟糕。我们接着试了用sarkosyl做
变性剂的蛋白重折叠。步骤和前一个类似,只是这一次是突然稀释至25倍体积。效果好了很多,至少没有浑浊现象了。接着我们用Poros HS 50,一种阳离子交换柱,来把可溶的sigma 分离了出来。为什么这一次用Poros HS 50 而不是前面用的阴离
子交换柱呢?因为sarkosyl带负电,会与阴离子交换柱结合得很好。再加上sigma32
很奇怪,既有负电的表面,又有带正电的表面,所以可以用阳离子交换柱。值得一提的是绝大部分蛋白质都是偏酸性,所以阴离子交换柱用的比阳离子交换柱频繁得多。
好了,聊完离子交换柱,现在回到Dr Burgess要我们作的另一个很重要的实验。
Sigma32在大肠杆菌过表达的时候,绝大部分都是inclusion body,但是也有一部分
是可溶的。这些可溶的sigma 32可以和细菌体内的Core RNA polymerase结合形
成复合体。我们这个实验就是要把这个复合体纯化出来。核心办法是用免疫亲合柱来纯化。但是为了提高纯化的效果,Burgess要我们提前用PEI沉淀的办法来粗分一下。PEI 是什么呢?就是polyethyleneimine (聚乙烯亚胺)。这个东东我过去没碰到,所以很感兴趣。PEI呢是一个带正电的polymer,和酸性蛋白质和核酸结合以后聚合体沉淀出来。由于这种结合是受离子强度影响的,感觉上很象DEAE那之类的性质,所以Burgess称之为\"液体DEAE\"。RNA polymerase和DNA是结合的,所以PEI沉淀DNA的同时,把RNA polymerase+sigma32都沉淀了下来。然后再用高盐洗脱蛋白质,而DNA和PEI结合很紧密,所以还是在沉淀里面。这样一来,好多垃圾蛋白和核酸都被去掉了。到了这一步,还有一个问题。就是洗脱下来的蛋白里面还有PEI,如果现在就用透析的办法降低盐浓度,PEI和蛋白会重新形成沉淀。所以下一步就是用硫酸胺沉淀的办法把蛋白和PEI分开。用低盐buffer重溶沉淀的蛋白,过免疫亲合柱就行了。免疫亲合柱就没有什么好说的了。最后结果很不错,跑胶后用coomassie blue 就可以清楚的看到RNA polymerase的各个亚基。
(九) 沉淀,沉淀,沉淀
上一部分我匆匆提到了用硫酸氨沉淀来去掉PEI(Polyethyleneimine)的步骤。不常做生化的同学可能对硫酸氨沉淀的方法不熟悉。但其实这种沉淀是蛋白质纯化中及其重要的一种方法。说实话我过去也很少接触,但是在这个课里面,四组实验中有
三个都用到了这个方法,可见其重要性。
硫酸氨沉淀是怎么做的呢?其实很简单,把磨细了的硫酸氨粉末往样品溶液里
倒就行了,蛋白就会相继沉淀下来。由于不同的蛋白,在不同的硫酸氨浓度下被分
别沉淀下来,这种方法把蛋白质样品粗粗的分离一下。这种方法对大量样品尤其好
用,因为比较方便快捷便宜。硫酸氨沉淀的优点是什么呢?最大的优点是这东西虽
然能让蛋白质沉淀下来,但是不会让蛋白质变性,所以沉淀下来的蛋白质一般可以
重新溶解。
其实沉淀蛋白质的方法有很多种,但是对于娇贵的蛋白质来说,很多常用方法
都太harsh了。我举两个例子把:TCA沉淀大家都熟悉的。TCA是个强酸,施放出
来的质子中和了蛋白质的负电荷,只留下正电荷与TCA形成不溶物,从而变性。
丙酮沉淀,通过改变介电常数来降低蛋白质的溶解度,从而沉淀,由于丙酮一类的
有机溶剂可以与蛋白质的疏水表面相互作用,所以沉淀的同时,蛋白质也会变性。
硫酸氨沉淀的机理是什么呢?简而言之就是盐析(salt out)。蛋白质在溶液里
面溶解度和盐浓度有关系。在低盐浓度下,如果增加盐浓度,会增强蛋白质的溶解,这是因为,盐的离子与蛋白质表面的正负电荷配对,减少了蛋白质电荷表面相互作用的机会。当盐浓度高到一定程度的时候,过多的盐会跟蛋白质疏水表面争夺水分子,以至于蛋白质疏水表面倾向于相互作用形成聚合物沉淀下来。
硫酸氨如果运用的好可以帮很大的忙。Dr. Burgess讲过一个例子。他有一年去
一个公司做sabbatical。这个公司是做单抗的,有一个工序是要从ascites fluids 里
头把抗体给纯化出来。这个公司用硫酸氨沉淀的方法来粗分蛋白。Burgess很惊讶的发现,这个公司竟然没有做仔细的分析,就随便用了一个很高的硫酸氨浓度,结果把抗体和serum albumin一起沉淀了。但是其实可以用一个低一点的浓度,只把serum albumin沉淀下来,从而把抗体和serum albumin分开。Serum albumin浓度是非常高的了,这样一分,大大提高了后续纯化步骤的效率。
Dr. Burgess强调说,用什么浓度把什么蛋白沉淀下来,完全是经验性的,而且每
次都不一定能重复的。因为是否能沉淀下来跟蛋白质浓度有关系,而每次样品内目标蛋白的浓度不一定一样。有一个很简单的方法可以用来估计蛋白质沉淀所需硫酸氨的浓度。把样品分成五份,每份分别加硫酸氨至20%, 30%, 40%, 50%, 60%, 离心去掉沉淀,保留上清,再向上清里面添加硫酸氨使浓度从20%到30%, 30%到40%, 40%到50%, 50%到60%, 60%到70%,离心保留沉淀,然后分析沉淀里的蛋白, 看看目标蛋白到底在 哪里,就完事了。
(十) 永远的转录因子
第一个模块的实验结束以后,我们进入第二个模块的实验。这个实验的指导教授叫Al Courey。这个模块的实验主要是要从Hela细胞里纯化AP-1。AP1是一种很重要的sequence specific转录因子,在很多生理过程里都有作用。AP-1其实不是一种均一的蛋白质,实际上一种二聚体结构,要么 是Jun-Jun 或者是JunFos dimer。Jun和Fos都是alpha helix的结构。Helix的一边有很多Leu,和另一个helix形成Leucine Zipper的结构,而helix另一边就是碱性的氨基酸居多,所以可以和DNA 结合。这个转录因子看起来就象一双筷子夹着DNA。
sequence specific转录因子是极其重要的一类蛋白质,真核生物的基因有5~10%是用来编码这种蛋白的。这个模块涉及的一些实验是最经典的一些分离转录因子的方法,所以很有用。
怎么才能分离纯化呢?首先要确定要纯化什么因子,换句话说就是要决定纯化跟什么特异DNA序列相结合的转录因子。决定了这个,才能有一个活性检测系统,才能真正开始纯化。另外就是,可以把这种特异序列的DNA固定在柱子上,然后做亲合层析,纯化效率会非常高。
整个纯化过程是这样的:首先制备Hela细胞的核提取物,然后用硫酸氨沉淀的办法粗分一下组分,小分子量蛋白(比如Histone H1) 因为无法沉淀而被去掉。到这里比活力会增加到原来的2倍。然后粗分的产物再跑一下凝胶过滤层析,比活力再提高到初始产物的5到10倍。凝胶过滤的产物再过DNA affinity column, 比活力从5-10倍一下子提到了50~100倍。到了这一步,AP-1可以占到蛋白量的 10~50%。
值得一提的是这个凝胶过滤层析。我们用的是Sephacryl S-300 HR 凝胶(一种聚
丙烯酰胺凝胶),这种凝胶分辨范围大概是10KDa到几千KDa,但是这种凝胶是比较粗的一种介质,分辨率不能跟superdex之类的比。大概由于不是那么精细,所以可以自己手工装柱,我们用的柱子是Amersham的XK26/40(直径2.6cm, 高度40cm)。装好的柱子分辨率真的是很低,AP1的洗脱体积跟空体积(void volume)相差挺小,而AP-1只有40~50KD已经很小了。这样一来很多蛋白根本没可能和AP-1分开!这也就是为什么这一步纯化倍数很小的原因。这样一来,为什么要自找麻
烦做这又贵又麻烦的一步呢?原因在于这一步可以去掉核提取物里面的核酸酶,所以如果直接跑DNA affinity column, column上的DNA Oligos会被降解掉!另外一个原因是,核提取物有一些可以和DNA非特异结合的蛋白,这些蛋白会饱和DNA affinity column,影响要转录因子的纯化。
这个纯化步骤说明,不同的纯化手段必须加以精心组合才会有最好的效果。