蛋白质组学研究的一般工具与方法
吉凯
随着人类基因组计划取得巨大的成功和许多物种基因组测序的完成,仅仅靠基因组的序列来试图阐明生命现象是远远不够的,因此,研究重心已经开始从揭示生命的所有遗传信息转移到在分子整体水平对功能的研究上,生命科学已实质性地跨入了后基因组时代。
尽管现在已经有多个物种的基因组被测序,但这些基因组中通常有一半以上基因的功能是未知的。目前功能基因组研究中所采用的策略,如微阵列法(microarray)(Wodicka et al.,1997)、基因芯片(gene chips)(Ramsay et al.,1998)、基因表达序列分析(SAGE)(Velculescu et al.,1995)等,都是从细胞中 mRNA 的角度来考虑的。但事实上,从 DNA、mRNA 到蛋白质存在三个层次的调控,mRNA 自身也存在着贮存、转运和降解等问题,从 mRNA 角度考虑,实际上仅包括了转录水平调控,并不能全面代表蛋白质表达水平。实验也证明,组织中 mRNA 丰度与蛋白质丰度的相关性并不好,尤其对于低丰度蛋白质来说,相关性更差。蛋白质复杂的翻译后修饰,蛋白质的亚细胞定位或迁移,蛋白质-蛋白质相互作用则几乎无法从 mRNA 水平来判断(曾嵘,夏其昌,2002)。新生肽链合成后存在多种加工、修饰过程,蛋白质间也存在类似于 mRNA 分子内的剪切、拼接,研究证明基本元件「intein」广泛存在于蛋白质中(Perler et al.,1997)。基因与其编码产物蛋白的线性对应关系只存在于新生肽链而不是最终的功能蛋白质中。
蛋白质是生理功能的执行者和生命现象的直接体现者,对蛋白质结构和功能的研究将直接阐明生命在生理或病理条件下的变化机制;蛋白质本身的存在形式和活动规律,如翻译后修饰、蛋白质间相互作用及蛋白质构象等问题,仍依赖于直接对蛋白质的研究来解决。因此要对生命的复杂活动有全面和深入的认识,必然要在整体、动态、网络的水平上对蛋白质进行研究(钱小红,贺福初,2003)。
蛋白质组学研究中常用的技术体系
方法学上,二维凝胶电泳-质谱仍然是目前最流行和可靠的技术平台(Rabilloud et al.,2000)。其一般过程是:细胞或组织样品――样品制备――二维凝胶电泳(2D-PAGE)分离蛋白质――计算机辅助分析 2D-PAGE 图象――对感兴趣的蛋白质进行酶解――质谱分析――数据库检索――蛋白质鉴定――分析蛋白质在细胞与组织中的表达情况。
2-D PAGE
样品制备
2D-PAGE 的操作流程基本上实现了程序化。但是,样品制备是一个非常关键与复杂的过程。成功的 2D-PAGE 取决于对样品中蛋白质有效的抽提和它的溶解性。与核酸不同,目前没有一种通用的方法适用于所有的蛋白质,来源不同的蛋白质都受到自身蛋白质制备方法的挑战。
正确的样品制备方法从收集样品开始时就要防止样品的裂解和被蛋白水解酶降解(Rabilloud et al.,2000)。要尽可能溶解更多的蛋白,并且在 2D-PAGE 过程中保持它的溶解性,阻止蛋白质的人为修饰。在样品制备过程中,各个实验室也通过实验建立了更为可行的方法。目前通过建立分步提取方法可以有效地提取出更多的蛋白质(兰彦等,2001)。另一种对蛋白质采用预分离的方法称为「多间隔电解法(multi-compartment-electrolyser)」,采用这种方法后,分辨率和胶的质量均明显改善(Herbert et al.,2000)。
但是,由于生物样品的多样性和复杂性,目前所采用的样品制备方法具有局限性。其它物质对蛋白质样品制备存在干扰。核酸通过与蛋白质结合,增加样品黏度而干扰等点聚焦(IEF)分离的效果。当然,通过实验探索,采取一些措施可以减轻它的干扰。例如,在样品制备过程中加入非特异性的核酸酶或 RNase 与 DNase 的混合物,在等电聚焦时将每个胶条的电流限制在 50mA 以内通常可以消除其影响。脂类物质的影响可以通过利用有机溶剂的方法将其去除,但是这常常会导致蛋白质的不可逆沉淀。除了蛋白质的降解之外,糖基化是蛋白质的最重要的人工修饰,样品中的尿素在这一过程中起着非常重要的作用。样品中的尿素在降解的过程中会形成能够与蛋白质的氨基反应的氰酸盐,这种结果会导致蛋白质带有更多的正电荷。所以,在 2D-PAGE 中要用新鲜的尿素溶液,在等电聚焦过程中要控制温度不能太高(Beranova-Giorgianni,2003)。但是,目前还没有一种简单有效的方法来去除样品中的多糖。
样品分离和分析
样品制备完成后运用 IEF 和 SDS-PAGE 电泳对它进行分离,常采用银染和考马斯亮兰染色即可观察到具有许多蛋白质斑点的凝胶图像。等电聚焦电泳与 SDS-PAGE 的具体操作步骤已经实现了程序化,均有详细操作流程参考,但是由于样品的不同,不同样品的具体条件还需要试验探索。第二相 SDS-PAGE 运行结束,染色完毕后,利用计算机软件对凝胶图像进行分析,如 PD-QUEST 软件,LIPS,HERMES,GEMINI 等,对凝胶图像上的蛋白质斑点进行匹配,对图像进行数字化处理等分析(贾宇峰等,2001),对感兴趣的蛋白质采用质谱分析。
低丰度蛋白质的检测
低丰度蛋白在蛋白质组学研究中常常是人们非常感兴趣的,因为细胞或组织中的一些生物活性物质,如细胞分泌的一些活性物质,受体等表达量都非常低。按照一般电泳的上样量,这些小分子是根本看不到的,但如果单纯地增加上样量,细胞或组织中的大量表达的蛋白就会将其覆盖,而且上样量过大也会影响电泳结果。所以对这些低丰度的样品可以进行富集,富集的方法可以通过层析,如亲和层析,离子交换层析等方法,还可以通过利用样品等电点性质等方法将 pH 范围相近的蛋白质富集(Santoni et al.,2000; Beranova-Giorgianni,2003)。
生物质谱
对于双向电泳中感兴趣的蛋白质点,可以从聚丙烯酰胺凝胶中切下,经过酶解后采用生物质谱进行分析鉴定。生物质谱技术是蛋白质组学研究中最重要的鉴定技术,其基本原理是样品分子离子化后,根据不同离子之间的荷质比(M/E)的差异来分离并确定分子量。对于经过双向电泳分离的目标蛋白质用胰蛋白酶酶解(水解 Lys 或 Arg 的 -C 端形成的肽键)成肽段,对这些肽段用质谱进行鉴定与分析。目前常用的质谱包括两种:基质辅助激光解吸电离-飞行时间质谱(MALDI-TOF-MS)和离子阱质谱(ESI-MS)。
基质辅助激光解吸电离-飞行时间质谱(MALDI-TOF-MS)
MALDI 的电离方式是 Karas 和 Hillenkamp 于 1988 年提出。MALDI 的基本原理是将分析物分散在基质分子(尼古丁酸及其同系物)中并形成晶体,当用激光(337nm 的氮激光)照射晶体时,基质分子吸收激光能量,样品解吸附,基质-样品之间发生电荷转移使样品分子电离。它从固相标本中产生离子,并在飞行管中测定其分子量,MALDI-TOF-MS 一般用于肽质量指纹图谱,非常快速(每次分析只需3-5min),灵敏(达到 fmol 水平),可以精确测量肽段质量,但是如果在分析前不修饰肽段,MALDI-TOF-MS 不能给出肽片段的序列(钱小红等,2003)。
离子阱质谱(ESI-MS)
ESI-MS 是利用高电场使质谱进样端的毛细管柱流出的液滴带电,在 N2 气流的作用下,液滴溶剂蒸发,表面积缩小,表面电荷密度不断增加,直至产生的库仑力与液滴表面张力达到雷利极限,液滴爆裂为带电的子液滴,这一过程不断重复使最终的液滴非常细小呈喷雾状,这时液滴表面的电场非常强大,使分析物离子化并以带单电荷或多电荷的离子形式进入质量分析器(Whitehouse et al.,1985;Fenn et al.1989)。ESI-MS 从液相中产生离子,一般说来,肽段的混合物经过液相色谱分离后,经过偶联的与在线连接的离子阱质谱分析,给出肽片段的精确的氨基酸序列,但是分析时间一般较长。
目前,许多实验室两种质谱方法连用,获得有意义的蛋白质的肽段序列,设计探针或引物来获得有意义的基因。随着蛋白质组研究的深入,又有多种新型质谱仪出现,主要是在上述质谱仪的基础上进行改进与重新组合。
不足与展望
由于蛋白质组是一个动态、变化的整体,生物体内的蛋白质不能像核酸一样通过 PCR 扩增来增加样品量,因此其复杂性远远大于基因组。
双向电泳的通量、灵敏度和规模化均有待于进一步加强。二维凝胶电泳有分离容量的先天限制,染色转移等环节操作困难费时,低丰度蛋白难以辨别,和质谱技术的连用已经成为瓶颈。因此,国际上开始重视研究以色谱/电泳-质谱为主的技术平台。另一方面,酵母双杂交技术虽已经被用于研究蛋白质连锁群和蛋白质功能网络系统,但仍缺乏快速、高效的手段获取复杂蛋白质相互作用的多维信息。蛋白质的生物信息学研究,虽然已有应用,但仍困难重重。
虽然蛋白质组学的研究有它的局限性,但是技术改进并未停止。新技术的补充和双向凝胶电泳的新方法已成为蛋白质组研究技术最主要的目标。例如,在样品分离过程中对样品预分离以减少样本的复杂性,采用激光捕获显微切割技术以更为精确的分离需要的组织和细胞,固相化 pH 胶条和窄范围的 pH 胶条的使用可以分离到更多的蛋白质点,荧光染料的使用使得蛋白质的分离更加准确可靠,切胶和酶解的自动化减少了样品操作过程中角蛋白的污染。技术方面,二维色谱(2D-LC),二维毛细管电泳(2D-CE),液相色谱-毛细管电泳(LC-CE)等新型分离技术都是目前发展的主要方向。另一种策略是以质谱技术为核心,直接鉴定全蛋白质组混合酶解产物。随着对大规模蛋白质组相互作用研究的重视,发展高通量和高精度的蛋白质相互作用检测技术也受到科学家的关注。此外,蛋白质芯片的发展也十分迅速,并已经在临床诊断中得到应用。