遗传学进展概述
互联网
据国家自然科学基金委员会2003年5月23日报道,最近,我国科学家成功分离和克隆了水稻分蘖的主控基因MOC1,该成果是由中国科学院遗传与发育研究所李家洋院士及其合作者在国内独立完成的。该研究结果已发表在Nature,2003,422:618上,这是我国分子遗传学基础研究领域的第一篇源自国内的Nature文章,标志着我国植物功能基因研究取得了重大突破。
分蘖是水稻等禾本科作物在发育过程中的一个重要的分枝现象,也是一个重要的农艺性状,它直接确定作物的穗数并进而影响产量。虽然对水稻分蘖的形态学、组织学及突变体都有过很多描述,但是控制分蘖的分子机制一直没有弄清。自1996年起,在国家科技部、国家自然科学基金委员会和中国科学院的共同资助下,李家洋和中国农业科学院国家水稻研究所的钱前博士等开始进行此方面的研究。经过不懈努力,项目组鉴定了一株分蘖的极端突变体——单杆突变体MOC1。通过遗传图谱定位克隆技术,分离鉴定了在水稻分蘖调控中起重要作用的基因MOC1,它的缺失可造成分蘖的停止。进一步的功能分析表明,该基因可编码一个属于GRAS家族的转录因子,该转录因子主要在腋芽中表达,功能是促进分蘖和促进腋芽的生长。对这一重要基因的深入研究,将有望解释禾本科作物分蘖调控的分子机制,对于水稻高产品种的培育有重要的理论和应用价值
走出“基因决定论”的误区
自从基因一词在20世纪初进入科学家的词汇表以来,它不仅是生物学家最为常用的词汇之一,也成为当今普通大众最为熟悉的科学术语之一。随着遗传学和分子生物学的进步,人们不仅知道了基因的化学性质——DNA序列,而且还认识到了基因的功能——编码蛋白质的氨基酸序列。由此,逐渐形成了一种广为流行的“基因决定论”:生命的各种性质和活动都是受基因控制的,甚至人类的精神活动也在基因的控制之下。不久前,芬兰赫尔辛基大学和瑞典卡罗林斯卡医学院的研究人员在某些患有诵读困难的病人中,发现了一种名为“DYXC1”的基因发生了突变。也就是说,人类的阅读可能受到这种“DYXC1”基因的控制。不可否认,基因对生命具有非常重要的作用,基因的异常通常就会导致生命的异常。但是,作为开放的复杂系统,生命活动从来就不是由一种因素就能完全决定的。当前越来越多的证据,正在向“基因决定论”挑战。科学家正在以一种全新的视野来理解生命现象。
不再是“垃圾
随着基因组研究的深入,人们发现,在多细胞真核生物的基因组中,基因仅是其全部DNA序列的一小部分。在人类基因组中,全部基因序列只占基因组的2%左右。基因组内的非基因序列曾一度被研究者称为“垃圾DNA”(junk DNA)。这些“垃圾DNA”中至少有一半是重复序列。过去一直认为这些重复序列没有功能,只是一些自私的DNA序列,热衷于自我扩张。但近年来的研究表明,重复序列在生命活动中有着重要的作用。
真核生物的染色体通常都是线状的,其末端由一段重复序列构成,称为端粒。端粒在染色体的稳定和控制细胞的寿命方面都起着关键的作用,还有可能涉及癌症的发生。在肿瘤细胞中,参与端粒复制的端粒酶具有异常的活性;如果用化合物抑制肿瘤细胞内的端粒酶活性,就有可能杀死肿瘤细胞。目前许多制药公司正在开发作为抗癌药物的端粒酶抑制剂。
在基因组的重复序列中有一个大家族,被称为Alu家族。每一个Alu片段大约有300个核苷酸。在人类基因组中,大约有140万个Alu序列,占整个基因组的10%。随着人类基因组全序列的测定,研究者对Alu家族的性质有了深入的了解。人们发现,Alu片段在过去的3000万年间快速而大量地富集于基因组GC碱基含量高的区域内,比GC贫乏区的Alu片段含量高13倍。有趣的是,GC富集的区域内基因的密度也比GC贫乏区大。显然,Alu序列与基因在基因组中的进化可能有某种相关性。2003年5月,以色列科学家在美国《科学》周刊上发表了他们的研究结果,揭示出Alu片段在基因剪接(splicing)过程中插入到完整的mRNA中的分子机理,表明重复序列在进化过程中可以用来帮助形成新基因。
不需要“序列”的遗传
随便打开一本经典遗传学教科书,里面都明确写着:遗传的分子基础是核酸,生命的遗传信息储存在核酸的碱基序列上。然而,随着“表观遗传学”(epigenetics)的兴起和有关研究工作的进展,这种经典的遗传观念正面临着巨大的挑战。
从遗传学的角度来看,同卵双生的孪生子具有完全相同的基因组。如果这两个孪生子在同样的环境下成长,从逻辑上说,俩人的气质和体质应该非常相似。但研究者发现,一些孪生子的情况并不符合预期的理论,往往在长大成人后出现性格、健康方面的很大差异。这种反常现象长期困扰着遗传学家。现在科学家们发现,可以在不影响DNA序列的情况下改变基因组的修饰,这种改变不仅可以影响个体的发育,而且还可以遗传下去。因此,这类变异被称为“表观遗传修饰”,并被认为是导致遗传物质一致的孪生子出现个体差异的主要原因。
肿瘤过去一直被认为与基因突变有着密切的关系。研究者发现了许多促进肿瘤发生的癌基因和抑制肿瘤形成的肿瘤抑制基因。但最近10多年来,通过对DNA甲基化模式的研究,人们发现许多种类的癌细胞都有着异常的DNA甲基化行为,肿瘤抑制基因常常被过量地甲基化而导致失去活性,而基因的DNA序列并不发生变化。此外,在结肠癌的细胞内,一种编码DNA损伤修复酶的基因“MLH1”由于甲基化而被抑制,从而引起了DNA损伤的增加。由此种种,科学家意识到,“表观遗传修饰”也是细胞癌变的一个重要原因。
“表观遗传修饰”除了DNA甲基化这种主要的方式外,还有一种常见的方式是修饰染色质结构。细胞内的DNA并非裸露,而是与组蛋白一起包装成致密结构的染色质。不同的染色质结构常常影响到基因的表达。通过乙酰化或磷酸化等化学方法对组蛋白进行修饰,可以引起染色质结构的改变,从而导致基因活性的改变。
重要的是,这些表观遗传修饰不仅影响着个体的发育与生长,而且还可以在不改变DNA序列的情况下遗传给下一代。澳大利亚科学家曾报道过这样一个工作:一个遗传完全一致的小鼠品系,其皮肤却具有不同颜色,即取决于对一个基因的甲基化程度。这种皮毛颜色的性状差异往往由母鼠传递给后代。不久前在果蝇的研究中,美国科学家也观察到了类似的现象。由此,科学家提出了一门新的遗传学——表观遗传学,研究在不改变DNA序列的情况下基因功能改变的机制,以及这种改变在有丝分裂和减数分裂过程中的遗传机理。
表观遗传学使人们对基因组的认识又增加了一个新视点:对基因组而言,不仅仅是序列包含遗传信息,而且其修饰也可以记载遗传信息。这种在基因组的水平上研究表观遗传修饰的领域被称为“表观基因组学”(epigenomics)。1999年欧洲的生物学家成立了一个“人类表观基因组联合研究体”(Human Epigenome Consortium,HEC),开始了表观基因组的研究。
离不开的环境
以上的讨论,不论是“垃圾DNA”还是“表观遗传修饰”,始终是在遗传物质——核酸的层面上展开。然而我们不要忘记,这一切活动都离不开生物体的内外环境。在经典的遗传学教科书里,都写着这样一条公式:表型=基因型+环境。不过,在大多数研究者的心目中,环境只是一个被动的因素,仅仅是为基因的功能实现提供相应的物质条件。这里依然保持着一种线性思维和简单的因果推理,即基因决定蛋白质,蛋白质决定性状。随着系统生物学的出现和复杂性观念的形成,可以认为,在一个复杂的生命系统中,基因是否发挥作用和基因作用的最终结果(表型)是什么,都与环境的动力学特性有着密切的关系。
这些动力学性质在生物体的各种层次由不同的分子网络负责。在基因组到转录组之间,由基因表达网络以及各种小分子RNA调节基因的活动和转录。在转录组到蛋白质组之间,由蛋白质的翻译后修饰以及蛋白质-蛋白质相互作用网络给予控制。在蛋白质组与代谢组之间,主要是细胞的能量代谢和物质代谢网络参与协调。这种种复杂的网络与动力学系统的综合作用导致了特定的细胞行为或个体表型。
这种基因与环境的关系在复杂性疾病上有着明显的反映。首先,一个国家的疾病谱和发病率在一定时间内发生巨大改变的现象表明,环境对疾病有着巨大的影响,因为人群的遗传素质在短期内是比较稳定的。对结肠癌、中风、冠心病和II型糖尿病等多种复杂性疾病的统计学分析发现,至少70%的患者表现出各种不良的“环境因素”,如偏食、超重、不运动和抽烟。而且,如果对不良生活习惯加以改变,就可以大大地降低这些疾病的发生。例如,不抽烟,少喝酒,良好的饮食以及适量的运动,可以让冠心病和中风的患病率降低70%。也许可以这样说,越是复杂的性状或行为,环境发挥的作用就越强、越重要。
在“基因决定论”的背后,隐藏着一个重要的,长期以来争执不休的问题:环境的作用能否改变个体的遗传特性,并传递给下一代?这种被称为“拉马克学说”(Lamarckism)的观点一直被正统的生物学家拒之门外,但现实的生命世界又一次次地把这个话题送到研究者的视线内。瑞典一个科学家小组曾在2002年11月发表了一项研究,他们的统计结果表明,对于生于1890—1920年的瑞典男人的孙辈而言,如果其祖父在青少年期间吃得很好,那么孙辈因糖尿病而死亡的概率就很高;如果其祖父是在饥饿中长大的,那么孙辈死于心脏病的机会就很少。也就是说,祖父辈的饮食状态影响到了孙辈的健康状态。从这个例子可以得到这样一种结论:个体在发育和生长过程中获得的环境影响,被遗传给了后代。从这里可以引申出一个更根本的问题:什么决定基因。大自然(环境)如此丰富多彩、如此变化不停,很难想象,对于一个开放的复杂生命系统,不会打上它的烙印。也许这是一个“先有鸡还是先有蛋”的进化论问题,但不论怎样,基因不会代表一切,更不能决定一切。”
他山之石,可以攻“异”——化学遗传学漫谈
遗传学的基本研究对象是生物体内的各种变异,包括宏观水平如个体或细胞的形态变化,以及分子水平如基因或蛋白质的突变。一般说来,基因的突变是引起个体性状改变的根源。因此,遗传学家的主要任务是通过研究基因的变异来发现基因的功能。自20世纪初现代遗传学诞生以来,在一个世纪的时间内,生物学家们发展出了许多研究基因突变的遗传学方法,揭示了众多基因的功能。然而,随着后基因组时代的到来,人们已不再满足于传统的遗传学手段,希望有一种能够快速、大规模研究基因突变的方法。由此,一门新兴交叉科学——化学遗传学(chemical genetics)便应运而生,利用大量的小分子化合物去研究基因的功能。
双 向 选 择
传统的遗传学手段大致可以分为“正向遗传学”(forward genetics)和“反向遗传学”(reverse genetics)两类。正向遗传学是指,通过生物个体或细胞的基因组的自发突变或人工诱变,寻找相关的表型或性状改变,然后从这些特定性状变化的个体或细胞中找到对应的突变基因,并揭示其功能。例如遗传病基因的克隆。反向遗传学的原理正好相反,人们首先是改变某个特定的基因或蛋白质,然后再去寻找有关的表型变化。例如基因剔除技术或转基因研究。简单地说,正向遗传学是从表型变化研究基因变化,反向遗传学则是从基因变化研究表型变化。
化学遗传学也同样继承了这两种不同的研究策略。正向的化学遗传学采用各种小分子化合物处理细胞,诱导细胞出现表型变异,然后经过筛选,寻找小分子作用的靶标(通常是蛋白质)。一个正向化学遗传学研究范例来自哈佛大学的科学家,他们采用哺乳动物细胞为筛选模型,观察了上万种化合物对细胞分裂的影响,从中发现了一个能强烈抑制哺乳动物细胞分裂的化合物monastrol;进一步的研究揭示,monastrol专一地抑制有丝分裂驱动蛋白Eg5[1]。
反向的化学遗传学采用了反向遗传学的思路,从基因或蛋白质与小分子化合物的相互作用来研究基因或蛋白质对表型的影响,从而找到这些生物大分子的功能。反向化学遗传学的起源可以追溯到20世纪初期德国生物学家埃尔利希(P. Ehrlich),他提出了受体(receptor)的概念:一个特定的蛋白质可以与一个小分子相结合;这种蛋白质被称为受体,与之结合的小分子被称为配体(ligand)。今天,埃尔利希的观点已经被生物学家广为认同,人们甚至认为每一个蛋白质可能都有一个特定的小分子。事实上,化学遗传学的主要目标就是要为每一个基因找到相应的小分子化合物。反向化学遗传学的一个成功的例子是,美国科学家采用一种化合物PD184352筛选与其作用的蛋白激酶,发现它可以专一地抑制一种调节细胞增殖的蛋白激酶MEK1;进一步的研究表明它可阻碍结肠癌的生长,从而揭示出MEK1在肿瘤的形成中有着重要作用[2]。
“化 学 银 行”
随着人类基因组计划的实施和后基因组时代的来临,经典的遗传学研究已走向规模化、系统化。其标志之一,就是出现了存储成千上万基因信息和序列的数据库——“基因银行”(GenBank)。化学遗传学也被烙上了同样的标记。2001年,美国国立卫生研究院下属的国家癌症研究所(NCI)启动了一个计划,希望全世界的科学家将所有小分子化合物的结构及其生物学效应或与蛋白质作用的信息,存入一个公共的数据库。这个公共数据库被称为“化学银行”(ChemBank)。预计在第一年为该计划投入1000万美元,以后逐年增大投入。NCI的所长克劳斯勒(R. Klausner)认为,通过实施“化学银行”计划,人们就可以系统地寻找和分析能够作用于蛋白质或细胞的具有生物活性的化合物。
开展化学遗传学研究的关键之一是要有大量的不同结构的化合物供筛选。monastrol就是从含有16320种小分子的化合物库中筛选得到的。新兴的组合化学显然是化学遗传学获得海量小分子化合物的核心技术。它的原理是,在同一个化学反应体系中加入不同的结构单元,利用这些结构单元的排列组合,就能够系统地合成大量的化合物。此外,现代化学合成技术的改进和发展,也为化学遗传学奠定了良好的基础。
要想从上万种甚至上百万种小分子化合物组成的化合物库中筛选出有效的分子,显然需要高通量的筛选方法,涉及到自动化、微量化和图像处理等各种高技术的运用。以微量化为例,1970年代分析一个化合物样品需要的体积是0.3毫升左右,1990年代减少到10微升,而最近几年已发展到只需要0.1微升。目前,人们针对两种不同的化学遗传学需求发展出了不同的高通量筛选方法。正向化学遗传学采用的是基于细胞的高通量筛选方法:将多细胞生物的某种细胞或单细胞生物体如细菌作为筛选模型,应用大规模平行检测技术,同时分析成千上万种化合物对细胞形态或活性的影响。而反向化学遗传学则是采用以蛋白质为靶标的高通量筛选方法,将特定的蛋白质植入具有96个孔或更多孔的培养皿,然后通过测定酶反应或结合能力,寻找与蛋白质发生作用的化合物。一般从1万到100万个化合物中,可以筛选到10到100个潜在的配体。
取 长 补 短
经典遗传学研究手段在长达一个世纪的实践中取得了巨大的成绩,至今依然是生命科学研究中一个重要组成部分。但是,经典遗传学的研究具有一些先天不足之处。首先,遗传突变通常是不可逆的,尤其是多细胞生物的基因突变。其次,绝大部分突变是不可控的,它们的活性无法按照研究者的愿望进行转换;即使有一些条件型突变,如温度敏感型突变,对温度的改变不仅仅影响突变,而且会影响到有机体的整体变化。此外,遗传突变的生物学效应比较缓慢,对于细胞内一些快速化学反应如信号传递,很难及时检测。遗传突变通常是质的改变——蛋白质活性的增加或丧失,难以研究其动态变化或动力学过程。最后,由于哺乳动物具有繁殖缓慢、个体大、巨大的双倍体基因组等特性,使得应用遗传学手段变得非常困难。
化学遗传学正好可以在一定程度上补偿这些经典遗传学研究的缺憾。化学遗传学的手段是可控的和可逆的——可以随时加入或除去化合物,从而启动或中断特定的反应。大多数小分子化合物对蛋白质的作用非常快,从而可以进行实时检测。此外,通过控制化合物的浓度,可以对其作用的靶分子的动力学过程进行分析。化学遗传学的另一个优点是,一个同样的化合物,可以被广泛地用于影响各种不同生物体的某一种过程或功能。化学遗传学的方法也基本上不受物种的限制,既可以用于低等生物,也可以高等生物。
不久前,人们在研究细胞的信号转导时,把经典遗传学和化学遗传学的研究方法结合起来,实现了优势互补。在信号转导过程中,蛋白激酶起着非常关键的作用。由于所有的蛋白激酶都有一个非常保守的ATP结合结构域,抑制蛋白激酶活性的小分子化合物通常是非专一性的:一种化合物可以抑制许多蛋白激酶的活性。为了寻找只作用于某一种蛋白激酶的专一性抑制剂,美国科学家发明了一种技术:首先用经典遗传学的方法把某种蛋白激酶的ATP结合位点上的一个氨基酸进行突变,制造出一个保持激酶活性但空间结构改变的突变型激酶,随后合成一系列可专门结合这一突变激酶的化合物,并筛选出只抑制人工突变蛋白激酶,而不抑制其野生型或其他蛋白激酶的小分子化合物[3]。这一方法不仅为在体内研究各种蛋白激酶的功能提供了有用的工具,还表明经典遗传学和化学遗传学的结合有可能为生命科学开拓更大的研究空间。
化学遗传学不仅是化学与生物学联姻的产物,也是基础研究与应用研究嫁接的成果。制药公司的目的通常是获得治疗疾病的药物——绝大多数都是小分子化合物。因此,现代化的制药公司一直采用大规模筛选小分子化合物的方法,去寻找具有药效的候选化合物,并且常常收集有数百万种化合物。在早些时候,这类化合物库是不出售的,学术界的研究人员无从进行大规模筛选的研究工作。现在,随着化合物库的商品化,科学家可以开展相关的研究了。从另一方面来说,化学遗传学研究所获得的成果——小分子化合物及其生物学效应,除了被用来揭示生命的基本活动规律外,还可能成为候选药物。也就是说,化学遗传学的研究活动不是单纯的基础研究,而与应用紧密相联。所以很多大型制药公司都非常关注化学遗传学。例如,哈佛大学在成立一个以从事化学遗传学为核心的“化学与细胞生物学研究所”时,著名的默克制药公司(Merck)就成为了该所的主要赞助者之一。可以说,化学遗传学的出现把传统的学术研究实验室引进了药物开发的战场。
<center> <p> </p> <p> </p> </center>