蛋白质组学在基础和应用生物学中的应用
互联网
在过去的一年里,随着双向电泳、质谱以及不同研究程序核心技术的改进,蛋白质组学保持着持续快速的进步。
完全注释的蛋白质组学数据库现在在一些领域已经出现了,并为系统研究提供了一个平台,在临床应用诸如心血管和肿瘤学中尤其有发展前途。大规模定量研究,在功能和敏感性上能与基因表达所达到的程度相媲美,因而在蛋白质水平上的研究也正变为现实。
简介
如果90年代是基因组的十年,新世纪的头十年将成为蛋白质组学的十年。蛋白质组学技术生成的定量表达数据第一次可以在规模和敏感性上与基因水平相媲美。
这个进展对于我们理解人类健康和疾病的细胞组成结构以及对药物、农业生物技术等有着重要的意义。确实,蛋白质组学业已在大范围应用中产生了重要发现。这篇文章综述了蛋白质组研究中的新概念、革新技术以及生物应用。
概念:结构对量化调节蛋白质组学
蛋白质组学的最终目标不仅仅是将健康和疾病状态下细胞表达的蛋白质分类。最终目标是阐明细胞生命赖以进行的代谢、信号传导和调控网络的组织和动力学。另外,蛋白质组学还寻求理解这些网络如何在疾病中失去功能以及如何通过干预诸如药物和基因操作操纵它们的功能。
这些是模糊不清的目标,在它们能够充分实现之前需要敏感性增强的技术和新的概念,但是对调节网络作图和细胞状态诊断的任务在不断进展。
在微生物中,VanBogelen等[1]已经识别了特殊细胞状态的蛋白质组信号,如分泌功能障碍和特殊磷来源的使用,并且目前正在结合基因组和蛋白质组方法试图作出完全的调节网络[2]。
然而,大多数蛋白质组研究都指向具体生理状态下蛋白质表达和功能等更近期的目标。这里,两个对立但是互补的策略已经出现了。一个是“表达”或者“定量调节”蛋白质组学,用来监控一个细胞或组织里大数量蛋白质的表达以及定量观察在不同环境下,诸如药物的存在或者在疾病组织里表达方式是如何改变的[3]。
这使得它可能识别疾病特异性蛋白质、药物靶标和药物毒性与效力的标记物,以及通过识别表达进行协调改变的蛋白质。这是目前最广泛应用和有效的蛋白质组学模型,现在还主要依赖于双向电泳(2DE)。
第二个策略被称为“细胞图谱”或者“结构”蛋白质组学[4]。这里,近期目标是识别蛋白质的结构,尤其是识别与其它蛋白质相互作用后形成复合体的蛋白质结构。通过记录蛋白质的物理相互作用,尽管没有定量调节蛋白质组学的所集中的幅度,这个策略可能对特别通路的具体研究很有效。
尽管双杂交以及相关的分析[5]对特异蛋白质-蛋白质相互作用的识别是重要的,结构蛋白质组学的最重要的技术是质谱(MS)。
技术:2DE和MS的改进
定量调节和结构蛋白质组学的区分是有用的,然而必须强调大多蛋白质组项目结合了两种方法并同时依赖2DE和MS。在过去的几年里这些核心技术已经有了显著的进展。
通过建立在zwitterionic去污剂[6]和有机溶剂[7]基础上的样品制备的持续进展,令人烦恼的用2DE分离高度憎水的膜蛋白质的问题也有了逐渐的进展,但是仍然是一个重要和未解决的问题。
从一个组织获得单一细胞类型样品的问题可以通过使用一个激光捕获显微切割系统来解决,一个组织样品附着在一个胶片上,然后同样目的的细胞用一个激光束脱离下来[8]。
蛋白质组学中MS的使用在功能和多样性方面已经有了一些显著改进而且继续演进。
一些研究组已经引入了新的蛋白质标记方法学改进了MS的功能和敏感性[9,10]。Aebersold和合作者[10]已经发展了一个用同位素编码的亲和标签(ICAT)标记肽的方法,它不仅支持复杂肽混合物的增强分析,也允许在蛋白质表达水平对差异进行精确的定量,这是MS为基础的蛋白质组学以前所没有的功能。
MS与一个软件工具FindMod的配对也增强了该方法识别转录后的修饰能力[11]。
定性蛋白质复合体的技术也被引进,包括基于液相色谱/串联MS[12]的系统以及发展一个新的串联亲和纯化(TAP)标签以从细胞样品中快速纯化复合物[13]。其它样品处理方法的进展近来允许对分泌囊中的肽用MS直接进行分析,并可望用同样的技术对其它细胞器进行分析[14]。
当然,通过结合2DE和MS为基础的方法蛋白质组学能获得最低点的功能。一个代表性的结合例子是Hochstrasser研究组[15]所发展的系统,整个2DE凝胶进行原位消化,电转移到膜上并直接用MS扫描,生成注释的2D图谱。这样的发展在一些专业蛋白质组学公司已经开创,现在可以使得蛋白质组学在与项目本身复杂性相对应的规模上开展起来。
蛋白质组数据库
蛋白质组数据库含有不同细胞状态下获得的2DE注释数据,它是基本的平台,从数据库蛋白质组研究解决具体的生物学和药物学问题。然而值得注意的是目前相对少的大规模数据库已经出现到公共区域里来了。
酵母蛋白质数据库是最好的和建立最久的一个大规模数据库,它的主办者Proteome Inc(Beverly,MA)现在正在构建WormPD[16],这是一个线虫C.elegans的蛋白质组数据库,该线虫的完整基因组已经被测序。
在过去一年里,最重要的数据库发展是Hoffmann-La Roche构建的流感噬血杆菌数据库,包含超过1000个独立的2DE蛋白质点的图谱,其中500多个独立蛋白质已经被识别[17]。
Klose和合作者[18]近来也报道了它们正在发展的小鼠蛋白质组数据库,开始的重点是大脑蛋白质。在人类,Celis等建立的膀胱癌数据库[19]仍然是目前所能获得的最大和注释最好数据库之一,尽管再过几年一定会看到生成大范围的人组织的蛋白质组数据库。
设计解决人和其它生物体具体生物问题的较小蛋白质组数据库的数目现在已经很庞大,超过了此综述所谈的范围。Expasy网站是主要SWISS-2D PAGE蛋白质组数据库和其它资源的主页,含有大量的链接,仍然是探索公共蛋白质组学数据库的最佳平台。
基础生物学
解决基础生物学问题的蛋白质组学项目的数目目前已经很大了并且继续增长。这一部分反映了“蛋白质组学”这个词的广泛用途,不仅包含了大规模生物技术研究,也包括了使用2DE、MS或其它技术系统研究蛋白质的项目。
从蛋白质组学扩展出来,对普通生物学来说是一个最重要的主题是深入探索基因和蛋白质关系的本质。在上述Klose及同伴的小鼠蛋白质组项目中[18],基于蛋白质多样性,几百个小鼠基因被定位到染色体上。
这些研究所呈现的是许多蛋白质修饰与具体的基因关联,于是一个蛋白质应该被认为不是一个而是许多基因的表现型[20]。同样的,一个基因突变会影响许多蛋白质。最终,这种研究会有助于更成熟地理解健康和疾病中基因和细胞功能的关系。
结合免疫层析技术和2DE以及随后的MS仍然是研究某个细胞蛋白质组的某个具体亚系的主要载重马。
无数基础细胞机制的研究正用这个方法进行着。比如,用抗磷酸酪氨酸和抗磷酸色氨酸抗体的免疫印迹被用来从小鼠成纤维细胞中提取超过500个磷酸化的蛋白质,其中至少100个在用血小板衍生的生长因子(PDGF)刺激后进行了磷酸化改变[21]。这些研究揭示了PDGFb受体下游推测信号的新传导途径,并使用到其它信号传导途径。
第二个例子,免疫沉淀被用来从E.coli提取伴娘分子GroEL,与超过300个新翻译的多肽形成复合体,它们随后用2DE进行分离。这个技术能够研究介导蛋白质折叠的GroEL的功能,并是一个如何能够被用来靶向和研究一个具体的细胞成分亚系的典型蛋白质组学技术。
这一部分的最后值得提出的是:蛋白质组学是植物生物学和农业生物技术的新兴领域[23]。植物蛋白质组学研究包括定性个体和系的鉴定、评估群体内部和之间的遗传多变性[23]。
临床研究
蛋白质组学的潜能在临床范围似乎是无限的,因为与任何给定疾病状态相关的蛋白质现在能够容易地被识别,如果样本充分而且在一个合适的规模上,就能进行研究。现在已有许多以蛋白质组学为基础的临床研究,每个月项目的数目都在增加。近来新西兰的奥克兰大学报道了一组有意思的数据,那里人海马蛋白质组图谱的构建 [24] 产生了在精神分裂症中识别出18个异常表达的蛋白质,其中的一些发现定位在6号染色体的同一区域[25]。这些蛋白质在此疾病的发病原理中的作用目前正被研究之中。
英国Harefield医院的Dunn及同事几年来致力于蛋白质组学在心脏疾病中的一个主要临床应用,此项目近来已经被做了简单的介绍[26]。这项工作建立在良好的蛋白质组学数据库的坚实基础之上,近年的工作包括识别扩张性心肌病的疾病特异性蛋白质[27,28]以及研究抗内皮细胞抗体作为潜在的预测慢性心脏移植排斥的实验[29]。但是基因组学在肿瘤学蛋白质组学找到了其最广泛的临床应用,主要是通过用2DE为基础的技术比较正常和肿瘤组织。过去的一年里已经看到在一定范围肿瘤类型的蛋白质组学文献发表,其中最引人注意的是膀胱和乳腺癌的研究。在膀胱鳞状细胞癌中,Celis等[30]使用上述数据库识别出几个疾病特异的蛋白质,它们被用来制作抗体识别转移损伤。该组发现了psoriacin作为膀胱鳞状细胞癌的蛋白质标记物,它可能提供了一个有用的、非创伤性的方法进行疾病监控[31]。
在过去的几年里,一些研究组已经描述了乳腺癌的蛋白质组研究。最近研究报道的第一步是在正常腔和肌上皮乳腺细胞中分离超过1700个蛋白质点,它们在两种细胞类型中差异表达[32]。两种细胞类型的分离是这个研究的一个重要特点,因为~95%的乳腺肿瘤是腔细胞起源的。这个详细研究的下一阶段将确定肿瘤细胞的蛋白质组以及鉴别其与健康腔细胞蛋白质组的区别。
毒理学
毒理学可能是蛋白质组学应用的一个最重要的应用。2DE是一个高度敏感筛选毒性和探索毒性机制的手段。通过比较一个给定药物治疗后蛋白质的表达与未处理情况下蛋白质表达,有可能凭与药物效力或毒性相关的成套蛋白质来改变识别生物化学通路的改变。当为已知毒性的化合物构建一个足够大的蛋白质组标志的文库时,就有可能用它来评价新化合物的毒性。然而,进入公共范围的毒理学大规模蛋白质组学研究还很少。一个在Imperial College London/SmithKline Beecham的一个研究组所进行的研究报道,将大鼠暴露在puramycin aminonucleside后,用2DE和NMR为基础对肾小球进行毒性检测的研究[33]。通过监控尿中的蛋白质,该研究使得人们能够比以前更详细地理解与肾小球毒性相关的蛋白质尿的本质与演进。第二个例子,研究人员在兔铅毒性模型的研究中识别了一些蛋白质在增加铅剂量后表达的改变,其中的一些分子暂时识别为谷胱苷肽-S-转移酶的突变体,并可能会发展为人类铅毒性的有价值的标记物[34]。其它近来出现的值得注意的蛋白质组毒理学研究报告包括环孢菌素A毒性的分析,它揭示了一个新的牵涉到钙结合蛋白质calbindin-D的毒性机制[35],以及正在进行的暴露啮齿类动物于过氧化物酶体增殖物后肝蛋白质的改变[36,37]。然而,尽管无数其它毒理研究使用了蛋白质组学工具诸如2DE和MS,蛋白质组学在常规毒理学的潜力还未实现。
结论
过去的一年已经看到蛋白质组学持续的技术进展以及生物体蛋白质组织和功能上主要且持续的数据流的开端。尤其是,在编辑从微生物到人肿瘤范围的蛋白质表达数据库以及在无数生物体中识别大范围细胞状态特异的蛋白质上都有了重要进步。2DE和MS技术是现代蛋白质组学的主要驱动力,并在不久的将来仍会是这样,尽管更长的时间内新方法包括抗体为基础的技术和蛋白质芯片会挑战它们的主导地位。然而,在将来的几年里,通过现有的技术,蛋白质组学会有助于克服许多现代生物学和生物技术领域中最有挑战性的问题。
基因的功能研究是人类基因组计划完成之后急待解决的课题,其研究方法之一就是对基因表达产物—蛋白质进行研究,相对基因组学而言,人们将基因组的表达产物的研究称为蛋白质组学的研究,它是后基因组时代的一个重要的研究领域,其应用前景广阔。肿瘤对人类健康构成严重威胁,蛋白质组学在肿瘤研究中的应用进展较快,下面对肿瘤蛋白质组研究进展进行简要综述。
1 蛋白质组学在肿瘤研究中的应用
蛋白质组学的研究是从整体水平分析不同条件下蛋白质谱的变化,它的研究对象不是单一的或少数的蛋白质,而是着重其全面性和整体性,它综合利用了双向聚丙酰胺凝胶电泳(two-dimensional polyacrylamide gel electrophoresis,2D- PAGE)或新发展起来的 **_色谱、图象分析、质谱分析、氨基酸序列分析和生物信息学等手段和方法去分析、定量、表征蛋白质,通过蛋白质组学的研究分析可获得体系内所有蛋白质组分的物理、化学、生物学等方面的参数以及有关蛋白质功能分类、表达变化等方面的大量信息[1,2]。一般认为恶性肿瘤是由环境与遗传因素相互作用而导致的一种多基因复杂疾病,组织细胞发生癌变后,癌细胞不仅有许多特异蛋白质,而且这些产物还会影响其它蛋白质的翻译后加工及许多蛋白质的表达水平。蛋白质组学在肿瘤研究中的应用主要是比较分析正常的组织细胞与肿瘤组织细胞、肿瘤在不同发展时期的细胞内整体蛋白质的差异,获得肿瘤异质性的信息,鉴定出肿瘤标志物,进而为肿瘤诊断、治疗、预防以及发病机制的研究提供新的依据。
1)泌尿生殖系统肿瘤
Ostergaard等[3]在研究膀胱癌时发现在所有的膀胱癌患者的尿液中均存在一种低分子量的蛋白质—银屑素(psoriasin),它是由癌变的膀胱鳞状上皮细胞分泌到尿液中,作为膀胱癌的一种标志物,通过检测尿液中是否有银屑素的存在,对膀胱癌的诊断具有重要的价值。Sarto等[4]在肾癌的研究中发现有4 种蛋白质存在于正常的肾组织中,而在癌变的肾组织中由不存在,其中有两种分别是辅酶Q细胞色素C还原酶(ubiquinol cytochrome c reductase)和线粒体NADH辅酶Q氧化—还原复合物I(mitochrondrial NADH-ubiquinone oxide-reductase complex I),他们认为可能是由于某个基因位点的缺失或基因在转录或翻译时发生变化所致。此后他们又发现谷胱甘肽过氧化酶(glutathione peroxidase)的两种异构体和锰超氧化物歧化酶(manganese superoxide dismutase,Mn-SOD)的两种单体只出现在正常的组织中,而Mn-SOD多聚体只出现在肾肿瘤组织中[5]。Ornstein等[6]用激光捕获显微切割的方法获取正常的与癌变的前列腺组织上皮细胞,经2D-PAGE分析,发现有6 种蛋白质仅存在于癌变的细胞中,通过鉴定证实其中一种是前列腺特异抗原(prostate-specific antigen,PSA)。Franzen[7]等用蛋白质组学对乳腺癌进行了研究,发现乳腺癌组织细胞角蛋白(cytokeratin)和原肌球蛋白(tropomyosin)的表达量比正常的乳腺细胞下降,其下降程度与肿瘤的恶性发展程度密切相关。Bini等[8]用蛋白质组学对乳腺癌侵袭性导管瘤(breast invasive ductal carcinoma)进行研究,发现有32种蛋白质仅在导管瘤组织中强烈表达,而在正常的乳腺组织中不表达。Vercoutter-Edouart等[9]利用成纤维生长因子-2(fibroblast growth factor-2,FGF-2)刺激人乳腺癌细胞系MCF-7,然后对所诱导产生的蛋白质的变化情况进行分析,发现肿瘤细胞中的热休克蛋白90(heat shock protein 90,HSP90)和增殖性细胞核抗原(proliferating cell nuclear antigen,PCNA)的表达水平显著高于正常乳腺癌细胞。
2)消化系统肿瘤
Seow等[10]用蛋白质组学研究肝癌时,发现膜联蛋白(annexin)、抑制素(prohibitin)、硫氧还蛋白(thioredoxin)等几种蛋白质与肝癌的发生密切相关。Emmert-Buck等[11]用蛋白质组学的方法对我国的山西省肿瘤医院的两例食管癌患者的癌变食管鳞状上皮细胞与正常的食管鳞状上皮细胞进行了研究,用激光捕获显微切割获取样本,通过2D- PAGE分析,发现分子量在10-200kD,等电点在pH3-10之间的蛋白质有675种,其中有98%的蛋白质在两者之间的表达是相同的,但有17种蛋白质与肿瘤特异性相关,而其中有10种仅存在于肿瘤细胞中,是肿瘤特异性的标志物,而另外7种仅在上皮细胞中发现,然后对仅存在于肿瘤细胞中的10种肿瘤特异蛋白质进行质谱分析和免疫印迹分析,证实有一种是角蛋白I(cytokeratin I),还有一种是膜联蛋白I(annexin I)。
3)呼吸系统肿瘤
Hirano等[12,13]对原发性肺腺癌(primary lung adenocarcinoma)进行了研究,发现肺腺癌组织中有一种蛋白质强烈表达,这种蛋白质是由两种多肽组成,即TA01和TA02,它们的分子量相同都是35kD,只是等电点稍有差别,前者为5.45,后者为5.29,它们57例原发性肺腺癌,发现原发性肺腺癌组织中的阳性检出率分别这为80.7%和91.2%,这两种多肽的表达与细胞的畸变程度以及原发性肺腺癌的组织分化程度密切相关,分化程度高的原发性肺腺癌组织中高度表达,后来研究表明TA02是一种新型的天冬氨酸蛋白酶(aspartic protease)—Napsin A,它在原发性肺腺癌组织中强烈表达可能为其发病机制的研究指示出一条新线索。
2 结语
肿瘤蛋白质组学是一个研究热点,进展较快,目前的研究主要集中在泌尿生殖、消化、呼吸等系统中的几种常见肿瘤,有待于深入进行研究,但其应用前景广阔,主要表现在以下几个方面。一、在诊断方面,鉴定出肿瘤特异标志物,可为肿瘤的诊断,特别是早期诊断提供重要的工具。二、在治疗方面,通过蛋白质组学的研究,找到疾病时期的标志物,有助于设计作用于特异靶位的新药,为开发抗肿瘤新药打下基础。三、在预防方面,通过蛋白质组学的研究,鉴定出肿瘤特异的具有高免疫学活性的新蛋白质,有助于抗肿瘤疫苗的研究和开发。四、有助于肿瘤的预后分析,通过蛋白质组学的研究,获得与原发性肿瘤及其转移性相关性的信息,这对肿瘤的预后分析具有重要的意义。五、有助于肿瘤的发病机制的研究。通过蛋白质组学的研究,发现与疾病相关的蛋白质的异常表达情况,进一步研究这些异常蛋白质在疾病发发展过程中所起的病理作用,进而有助于从分子水平揭示肿瘤的发病机制。