后基因组时代的蛋白质结构与功能研究
丁香园论坛
1313
后基因组时代的蛋白质结构与功能研究
随着"人类基因组计划"的迅速进展以及包括水稻等30多种多种生物的基因组被完全测序,我们已经大步跨入了后基因组时代。在后基因组时代要回答和解决的众多问题中, 对这些基因编码的蛋白质的研究更显得重要和迫切。
结构基因组学 (Structural Genomics):
用大规模、高通量的方法测定尽可能多的蛋白质三维结构。研究的着重点不是所有的蛋白质,而是每种蛋白质家族的代表性结构域,因为结构域是蛋白质结构和进化的基本单位。该研究结果将能使我们从氨基酸的序列来预示蛋白质的三维结构,由此不但能帮助我们了解正常生理过程或疾病时蛋白质的功能,而且详细的结构信息极利于药物的设计。
目前,美国、日本、德国、加拿大、法国、瑞典、澳大利亚、以色列以及我国等国家都建立了结构基因组学研究中心。研究对象 除C. elegans、Yeast等一些模式生物外,有的还着重于技术的研究和开发,包括:靶序列克隆、高表达、微结晶的大规模、高通量和自动化。目前80%以上的生物大分子结构是用X射线衍射法得到的。过去的十多年里,同步辐射技术的发展大大推动了结构生物学的研究进展,根据国际蛋白质数据库(PDB)资料,至2002年4月23日总结构数为17902个, 其中属蛋白质或与核酸复合物形式的有16812个,占总数的94%。目前,40%以上的具有重要生物学功能的生物大分子结构是用同步辐射X射线测得的。结构基因组学研究中,同步辐射装置上样品测定的大规模、高通量和自动化也是在积极研究的课题,其中还包括自动结构确定的软件包的研究和开发。
蛋白质组学 (Proteomics) :
主要研究细胞内所有蛋白质在生命过程中的表达、蛋白质之间的相互作用、翻译后的各种修饰等。这些生命过程重要的性质单从基因水平上是无法知道的。如,经翻译后的各种修饰,一个基因序列有可能产生20多种结构不同的蛋白质。体内各种蛋白质的表达、功能的发挥和活动规律要受到时间、空间、环境等因素的调控, 这些只有用"蛋白质组学"的概念和技术才能解决。蛋白质组学研究中蛋白质的确定、表征和功能描述三大过程中首先面临的是将细胞内成千种蛋白质分离开,目前都是用二维凝胶电泳法;接着是用质谱、HPLC、N-末端氨基酸序列分析等方法对蛋白质进行表征。在记录和分析蛋白质表达谱、正常异常的差异确定、数据库及数据整合等过程中不但涉及数据自动采集和成像技术,还要依赖于生物信息学的理论和分析。目前人们正在积极研究和开发各种微量、快速、高通量和高自动化的技术,特别是基于芯片的自动化技术,甚至是单细胞的蛋白质组学。 (张志鸿 复旦大学生命学院)
随着"人类基因组计划"的迅速进展以及包括水稻等30多种多种生物的基因组被完全测序,我们已经大步跨入了后基因组时代。在后基因组时代要回答和解决的众多问题中, 对这些基因编码的蛋白质的研究更显得重要和迫切。
结构基因组学 (Structural Genomics):
用大规模、高通量的方法测定尽可能多的蛋白质三维结构。研究的着重点不是所有的蛋白质,而是每种蛋白质家族的代表性结构域,因为结构域是蛋白质结构和进化的基本单位。该研究结果将能使我们从氨基酸的序列来预示蛋白质的三维结构,由此不但能帮助我们了解正常生理过程或疾病时蛋白质的功能,而且详细的结构信息极利于药物的设计。
目前,美国、日本、德国、加拿大、法国、瑞典、澳大利亚、以色列以及我国等国家都建立了结构基因组学研究中心。研究对象 除C. elegans、Yeast等一些模式生物外,有的还着重于技术的研究和开发,包括:靶序列克隆、高表达、微结晶的大规模、高通量和自动化。目前80%以上的生物大分子结构是用X射线衍射法得到的。过去的十多年里,同步辐射技术的发展大大推动了结构生物学的研究进展,根据国际蛋白质数据库(PDB)资料,至2002年4月23日总结构数为17902个, 其中属蛋白质或与核酸复合物形式的有16812个,占总数的94%。目前,40%以上的具有重要生物学功能的生物大分子结构是用同步辐射X射线测得的。结构基因组学研究中,同步辐射装置上样品测定的大规模、高通量和自动化也是在积极研究的课题,其中还包括自动结构确定的软件包的研究和开发。
蛋白质组学 (Proteomics) :
主要研究细胞内所有蛋白质在生命过程中的表达、蛋白质之间的相互作用、翻译后的各种修饰等。这些生命过程重要的性质单从基因水平上是无法知道的。如,经翻译后的各种修饰,一个基因序列有可能产生20多种结构不同的蛋白质。体内各种蛋白质的表达、功能的发挥和活动规律要受到时间、空间、环境等因素的调控, 这些只有用"蛋白质组学"的概念和技术才能解决。蛋白质组学研究中蛋白质的确定、表征和功能描述三大过程中首先面临的是将细胞内成千种蛋白质分离开,目前都是用二维凝胶电泳法;接着是用质谱、HPLC、N-末端氨基酸序列分析等方法对蛋白质进行表征。在记录和分析蛋白质表达谱、正常异常的差异确定、数据库及数据整合等过程中不但涉及数据自动采集和成像技术,还要依赖于生物信息学的理论和分析。目前人们正在积极研究和开发各种微量、快速、高通量和高自动化的技术,特别是基于芯片的自动化技术,甚至是单细胞的蛋白质组学。 (张志鸿 复旦大学生命学院)