蛋白纯化策略

互联网2013-09-06

3095

（六）兴风作浪的乳糖(lactose)

　晚上每天都有人做报告，我觉得让我收获最大的是Bill Studier的报告。本来这个报告是后来才听到的，但是由于Burgess的模块是唯一的涉及大肠杆菌钟表达蛋白的，我把这一段提前来说说。Studier这老哥是Brookhaven National Laboratory的，一生研究T7 噬菌体，也是T7 RNA polymerase induction system(pET 系列质粒)的发明者。

T7 系统在大肠杆菌表达蛋白的应用实在太广泛了，但凡表达蛋白的兄弟姐妹们的不可能不知道这个系统。长话短说，pET系列的质粒都用T7 promoter来控制基因的表达。T7 promoter只能被T7 RNA polymerase 识别，而这个咚咚大肠杆菌是没有的。但是有一些溶原菌株,染色体里面已经整合入了由LacUV promoter和lac operon控制的T7 RNA polymerase 基因片断。如果在细菌培养基里面加入IPTG, 来诱导T7 RNA polymerase 的表达，就可以启动目的蛋白的表达。这个系统非常强大，原因
在于T7 RNA polymerase工作起来非常有效率，效率高到什么地步呢？就是表达一个蛋白，表达量可以占到大肠杆菌总蛋白量的50%! 大家可以想象，这种系统虽然很强大，但是表达量太大，对大肠杆菌有毒性，造成的结果就是大肠杆菌十分排斥表达蛋白的质粒。

这一点我深有体会。我曾经想用细菌表达一个蛋白,而且估计这个蛋白会形成包涵体。妖怪的是，用质粒转化蛋白表达菌株BL21(DE3)怎么也不能转化，铺的板一个菌落也没有。我当时就怀疑是因为表达的蛋白对大肠杆菌有毒性，仅仅是本底的一点表达就足以杀死细菌。我来来回回一共转化了五六次，最后终于找到了唯一的一个菌落。虽然当时我怀疑过本底表达是罪魁祸首，但是我没有仔细想过本底是怎么
来的。

这个问题到了bill studier做报告之后，才真相大白。原来我们一般用的LB broth有三种成分，其中一种是tryptone. Tryptone是caseine的酶解产物，而casein又是milk里提取而来。由于milk 有乳糖(lactose)，tryptone里面也有乳糖的污染。Bill studier研究发现即使很微量的lactose也能有效的诱导蛋白表达。原来如此！！！

所以要解决我原来的那个问题，用一种不含有乳糖的media做培养板就完事了。有意思的是，细菌有一种很有意思的特点，如果培养基里有足量的glucose，细菌会优先摄取glucose,而不能摄取lactose。Bill studier根据这个特点研究出一种可以自动诱导的培养基。这种培养基含有成比例的glucose 和 lactose。细菌首先摄取glucose，不摄取lactose,当细菌长到一定密度，耗完glucose之后，就开始摄取lactose,从而开始诱导表达。所以用这种培养基养菌，很省事，接种了第二天收细菌，提蛋白就行了。
　最后Bill studier老爷子特别强调的是细菌的供氧。氧气是限制细菌生长最重要的瓶颈, 如果有足够氧气在培养基里面, 大肠杆菌的密度可以从一般的OD600 2~3 翻十倍到20~30!要提高培养瓶的供氧，可以用baffled flask。这种flask的瓶底边缘有几处凹陷(类似于可乐塑料瓶底那样的形状)，能有效增加空气培养基的混合。

最后，详细内容可以见下列文献:
Protein Expression and purification 41: 207-234 (2005)

（七）古怪的CDC6

　这里再给大家讲一个在大肠杆菌中表达蛋白质的例子，一个很夸张的例子，但是很有启发性。
　　Bruce Stillman 是冷泉港的现任主管，是一个绝对的牛人。不但科学做得很好，而且还很爱国。他是澳洲人，在美国待了N年，却从没有加入美国国籍，所以他只是外籍院士。我们的晚间报告有一个是他作的。他主要研究真核生物的DNA复制。这是一个到现在为止都没有完全弄明白的领域。在报告里面，他特别提到了表达纯化CDC6蛋白的经历，我觉得十分有意思。这个蛋白, 用他的话说，是\"a pain in the ass\"。

CDC6是干什么的呢？这要从ORC说起。真核生物的DNA有多个复制起始位点 (replication origin)，ORC(Origin Replication Complex)是一个很大的蛋白复合体，可以识别这些复制起始位点。ORC在整个细胞周期里面都是与DNA结合的。在G1期里面，CDC6这个蛋白会与ORC结合，同时让MCM(DNA解旋酶)也装载到ORC上,形成一个prereplication protein complex。这个complex一旦形成，DNA 复制的准备工作就完成，只等其他kinase的激活，细胞从G1进入S期，复制就开始。
　Stillman 实验室一直想表达酵母的CDC6和ORC的重组蛋白，然后做结构研究。但是到了CDC6，他们碰到了大麻烦。首先他们尝试真核系统来表达，但是意外的是，他们发现表达出来的CDC6完全没有活性。然后他们尝试用大肠杆菌来表达。首先发现37度诱导表达出来的蛋白不溶，重折叠也没有用。然后他们尝试在室温下诱导表达，发现蛋白虽然可溶了，但是都被降解了。然后呢，他们就想到了加一个GST tag,这下好了，蛋白也可溶了，也不被降解了，但是还是没有活性。他们估计是因为GST可以形成dimer，干扰CDC6的正常功能。所以呢，他们重新做了一个construct,在GST和CDC6序列中间加了一个蛋白酶切割位点。正当他们满心欢喜的以为问题解决了的时候，意外又出现了。有GST的CDC6是可溶的，可是一旦把GST切掉了，CDC就沉淀出来了....@#%#^&%$^#!!!

几乎是山穷水尽了，但是做这个project的博士后还是没有放弃希望，他做了最后的孤注一掷。他猜到这个蛋白可能很不稳定，对缓冲液要求可能很高，所以他让一个本科生连续试了十多种buffer，最后发现如果用磷酸钾＋谷氨酸钾缓冲液，切掉GST之后CDC6就不会沉淀了。Stillman认为谷氨酸根和磷酸根跟氯离子相比更接近与核酸, 可能让CDC6更稳定。这个CDC6一共花了他们18个月时间, 却就这一点小trick!

这以后，他们表达的CDC6都有活性了，后来做了一系列的电镜三维结构重构实验，研究CDC6和ORC的复合体结构。Stillman实验室正在准备一篇文章要投到nature上去。大家等着看把。

（八）”液体DEAE“

　绕了这么大一圈，现在再回到第一个模块的实验来。前面提到Dr.Burgess要我们
试Gudn HCl溶解sigma32之后的重折叠，结果很糟糕。我们接着试了用sarkosyl做
变性剂的蛋白重折叠。步骤和前一个类似，只是这一次是突然稀释至25倍体积。效果好了很多，至少没有浑浊现象了。接着我们用Poros HS 50，一种阳离子交换柱，来把可溶的sigma 分离了出来。为什么这一次用Poros HS 50 而不是前面用的阴离
子交换柱呢？因为sarkosyl带负电，会与阴离子交换柱结合得很好。再加上sigma32
很奇怪，既有负电的表面，又有带正电的表面，所以可以用阳离子交换柱。值得一提的是绝大部分蛋白质都是偏酸性，所以阴离子交换柱用的比阳离子交换柱频繁得多。
　　好了，聊完离子交换柱，现在回到Dr Burgess要我们作的另一个很重要的实验。
Sigma32在大肠杆菌过表达的时候，绝大部分都是inclusion body,但是也有一部分
是可溶的。这些可溶的sigma 32可以和细菌体内的Core RNA polymerase结合形
成复合体。我们这个实验就是要把这个复合体纯化出来。核心办法是用免疫亲合柱来纯化。但是为了提高纯化的效果，Burgess要我们提前用PEI沉淀的办法来粗分一下。PEI 是什么呢？就是polyethyleneimine （聚乙烯亚胺）。这个东东我过去没碰到，所以很感兴趣。PEI呢是一个带正电的polymer，和酸性蛋白质和核酸结合以后聚合体沉淀出来。由于这种结合是受离子强度影响的，感觉上很象DEAE那之类的性质，所以Burgess称之为\"液体DEAE\"。RNA polymerase和DNA是结合的，所以PEI沉淀DNA的同时，把RNA polymerase+sigma32都沉淀了下来。然后再用高盐洗脱蛋白质，而DNA和PEI结合很紧密，所以还是在沉淀里面。这样一来，好多垃圾蛋白和核酸都被去掉了。到了这一步，还有一个问题。就是洗脱下来的蛋白里面还有PEI,如果现在就用透析的办法降低盐浓度，PEI和蛋白会重新形成沉淀。所以下一步就是用硫酸胺沉淀的办法把蛋白和PEI分开。用低盐buffer重溶沉淀的蛋白,过免疫亲合柱就行了。免疫亲合柱就没有什么好说的了。最后结果很不错，跑胶后用coomassie blue 就可以清楚的看到RNA polymerase的各个亚基。

（九）沉淀，沉淀，沉淀

上一部分我匆匆提到了用硫酸氨沉淀来去掉PEI(Polyethyleneimine）的步骤。不常做生化的同学可能对硫酸氨沉淀的方法不熟悉。但其实这种沉淀是蛋白质纯化中及其重要的一种方法。说实话我过去也很少接触，但是在这个课里面，四组实验中有
三个都用到了这个方法，可见其重要性。

硫酸氨沉淀是怎么做的呢？其实很简单，把磨细了的硫酸氨粉末往样品溶液里
倒就行了，蛋白就会相继沉淀下来。由于不同的蛋白，在不同的硫酸氨浓度下被分
别沉淀下来，这种方法把蛋白质样品粗粗的分离一下。这种方法对大量样品尤其好
用，因为比较方便快捷便宜。硫酸氨沉淀的优点是什么呢？最大的优点是这东西虽
然能让蛋白质沉淀下来，但是不会让蛋白质变性，所以沉淀下来的蛋白质一般可以
重新溶解。

其实沉淀蛋白质的方法有很多种，但是对于娇贵的蛋白质来说，很多常用方法
都太harsh了。我举两个例子把：TCA沉淀大家都熟悉的。TCA是个强酸，施放出
来的质子中和了蛋白质的负电荷，只留下正电荷与TCA形成不溶物，从而变性。
丙酮沉淀，通过改变介电常数来降低蛋白质的溶解度，从而沉淀，由于丙酮一类的
有机溶剂可以与蛋白质的疏水表面相互作用，所以沉淀的同时，蛋白质也会变性。

硫酸氨沉淀的机理是什么呢？简而言之就是盐析（salt out）。蛋白质在溶液里
面溶解度和盐浓度有关系。在低盐浓度下，如果增加盐浓度，会增强蛋白质的溶解，这是因为，盐的离子与蛋白质表面的正负电荷配对，减少了蛋白质电荷表面相互作用的机会。当盐浓度高到一定程度的时候，过多的盐会跟蛋白质疏水表面争夺水分子，以至于蛋白质疏水表面倾向于相互作用形成聚合物沉淀下来。

硫酸氨如果运用的好可以帮很大的忙。Dr. Burgess讲过一个例子。他有一年去
一个公司做sabbatical。这个公司是做单抗的，有一个工序是要从ascites fluids 里
头把抗体给纯化出来。这个公司用硫酸氨沉淀的方法来粗分蛋白。Burgess很惊讶的发现，这个公司竟然没有做仔细的分析，就随便用了一个很高的硫酸氨浓度，结果把抗体和serum albumin一起沉淀了。但是其实可以用一个低一点的浓度，只把serum albumin沉淀下来，从而把抗体和serum albumin分开。Serum albumin浓度是非常高的了，这样一分，大大提高了后续纯化步骤的效率。

Dr. Burgess强调说，用什么浓度把什么蛋白沉淀下来，完全是经验性的，而且每
次都不一定能重复的。因为是否能沉淀下来跟蛋白质浓度有关系，而每次样品内目标蛋白的浓度不一定一样。有一个很简单的方法可以用来估计蛋白质沉淀所需硫酸氨的浓度。把样品分成五份，每份分别加硫酸氨至20%, 30%, 40%, 50%, 60%, 离心去掉沉淀，保留上清，再向上清里面添加硫酸氨使浓度从20%到30%, 30%到40%, 40%到50%, 50%到60%, 60%到70%，离心保留沉淀，然后分析沉淀里的蛋白, 看看目标蛋白到底在哪里，就完事了。

（十）永远的转录因子
　　　
　第一个模块的实验结束以后，我们进入第二个模块的实验。这个实验的指导教授叫Al Courey。这个模块的实验主要是要从Hela细胞里纯化AP-1。AP1是一种很重要的sequence specific转录因子，在很多生理过程里都有作用。AP-1其实不是一种均一的蛋白质，实际上一种二聚体结构，要么是Jun-Jun 或者是JunFos dimer。Jun和Fos都是alpha helix的结构。Helix的一边有很多Leu,和另一个helix形成Leucine Zipper的结构，而helix另一边就是碱性的氨基酸居多，所以可以和DNA 结合。这个转录因子看起来就象一双筷子夹着DNA。
　sequence specific转录因子是极其重要的一类蛋白质，真核生物的基因有5~10%是用来编码这种蛋白的。这个模块涉及的一些实验是最经典的一些分离转录因子的方法，所以很有用。
　怎么才能分离纯化呢？首先要确定要纯化什么因子，换句话说就是要决定纯化跟什么特异DNA序列相结合的转录因子。决定了这个，才能有一个活性检测系统，才能真正开始纯化。另外就是，可以把这种特异序列的DNA固定在柱子上，然后做亲合层析，纯化效率会非常高。
　整个纯化过程是这样的：首先制备Hela细胞的核提取物，然后用硫酸氨沉淀的办法粗分一下组分，小分子量蛋白(比如Histone H1) 因为无法沉淀而被去掉。到这里比活力会增加到原来的2倍。然后粗分的产物再跑一下凝胶过滤层析，比活力再提高到初始产物的5到10倍。凝胶过滤的产物再过DNA affinity column, 比活力从5-10倍一下子提到了50~100倍。到了这一步，AP-1可以占到蛋白量的 10~50%。

值得一提的是这个凝胶过滤层析。我们用的是Sephacryl S-300 HR 凝胶(一种聚
丙烯酰胺凝胶)，这种凝胶分辨范围大概是10KDa到几千KDa，但是这种凝胶是比较粗的一种介质，分辨率不能跟superdex之类的比。大概由于不是那么精细，所以可以自己手工装柱，我们用的柱子是Amersham的XK26/40(直径2.6cm, 高度40cm）。装好的柱子分辨率真的是很低，AP1的洗脱体积跟空体积(void volume）相差挺小，而AP-1只有40~50KD已经很小了。这样一来很多蛋白根本没可能和AP-1分开！这也就是为什么这一步纯化倍数很小的原因。这样一来，为什么要自找麻
烦做这又贵又麻烦的一步呢？原因在于这一步可以去掉核提取物里面的核酸酶，所以如果直接跑DNA affinity column, column上的DNA Oligos会被降解掉！另外一个原因是，核提取物有一些可以和DNA非特异结合的蛋白，这些蛋白会饱和DNA affinity column，影响要转录因子的纯化。

这个纯化步骤说明，不同的纯化手段必须加以精心组合才会有最好的效果。