基因7(中文版)---首次公开!!!(1~4章)
丁香园论坛
3759
本书有29章,全是英文,经翻译成中文,首次在此公开,就是说还未出过正式的中文版,请珍惜。
现将第1章放上,因内容太多,打成文本将超过千页,将会陆续放上,当然,首先是大家都喜欢!
第1章 基因就是DNA
早在一个世纪以前,孟德尔(Mendel)定义了基因的基本属性。在他的两个定律中将基因归纳为一种“特殊因子”。在它从亲代传给子代的过程中是不改变的。同一个基因可能以不同的形式存在(突变)。
在二倍体的植物中,含有两个染色体组。每个子代从两个母代中各遗传到一组染色体。这同基因的行为相同。相当于发现染色体是基因的载体。
下一步是证明每条染色体是由线性排列的基因组成。孟德尔定律预测不同染色体上的基因将各自独立分开。然而在同一染色体上的基因表现为连锁遗传。基础观察显示不同染色体上的基因是以随机重组的方式代代相传,然而连锁性基因重组的几率下降,就是说它们有在一起不分离的趋势。
通过基因分析可以绘制出基因连锁图的结构,包含了1条染色体上携带的所有基因。连锁群的基因图与自然存在的染色体相一致。
在二十世纪前五十年建立高等生物的遗传图。基因被组合成像一个带子上的珠子。它们出现在固定的位置上,基因的重组包括同源染色体相同片断的迁移。基因是有各种可能的神秘物质(珠子),基因与它环绕物(带子)的联系是不清楚的。
高等真核生物重组图的建立因可相配的子代数目不多而受限制。两个接近的位点的发生重组的频率是很低的,仅仅可以观察在同一基因不同突变。可通过转移至产生大量后代的微生物系统中建立一个基因杂交体系,来示范发生在基因间的重组。这种方法同样符合以前推论的基因重组规律。
一个基因的突变可以呈直线排列,说明基因本身可以像在染色体上基因呈直线排列那样的直线结构。所以遗传图谱在基因之间是线性的:它由含有基因的完整序列组成。这个结论用现代的观点看就是,染色体的遗传物质是由代表很多基因的不间断的DNA组成。
基因组由任意特定生物体的一整套染色体组成,因此形成了一系列DNA分子,每个DNA分子包含一系列基因。因此最终确定基因组就是确定每条染色体的DNA序列。
图1.1总结了从过去对基因的构想到现在基因组的确定的不同阶段。在这一章,我们将分析基因组成中基本分子结构的根据。从已经证明的一个基因是由DNA组成及一条染色体是由表达不同基因的伸展性的DNA组成,我们转到复制和重组的自然基础,然后通过基因表达生成蛋白质。在第二章,我们着重处理更多的生物体的基因以及它的蛋白表达的细节。第三章里我们考虑基因的总体数量。在第四章,我们将讨论基因组的其它成分以及它结构的维持。
图1.1 遗传学的大事记
1865年 遗传因子是特殊的因子
1903年 染色体是遗传单位
1910年 基因位于染色体上
1913年 染色体上含有直线排列的基因
1927年 突变是基因的自然改变
1931年 交叉引起重组
1944年 DNA是遗传物质
1945年 一个遗传密码对应一个蛋白
1953年 DNA是双螺旋结构
1958年 DNA的半保留复制
1961年 遗传密码是三联体
1977年 DNA的测序
1997年 基因组测序
1998年
DNA是基本的遗传物质
在人们认识核酸的过程中,1928年发现的“转化”现象具有重要作用。老鼠被肺炎双球菌感染因患肺炎死亡。这种病菌的毒性来源于其表面的胶囊状多糖,因为表面的这种成分,它能使病菌免于被感染细胞分解。不同类型(I、II、III)的肺炎双球菌具有不同的胶囊多糖,但所有的有毒病菌的胶囊多糖的表面都是平滑型(S型)。
每个S型肺炎病菌都可能会发生某种变化而不能合成胶囊多糖,产生粗糙型(R型)表面病菌(由位于S型病毒胶囊多糖层下的物质组成),它们是无毒性的;在用R型病毒感染老鼠的实验中,由于被老鼠体内的抗体破坏而不会使老鼠致病。
对S型病菌进行热处理后,它们就不再具有毒性。但是一旦将这种热处理后的、无活性的病菌和R型病菌混合就会重新产生毒性。图1.2表明如果将两种无毒的病菌的混合物植入动物体内,就能使动物感染肺炎并死亡。而在病死的老鼠身上我们能检验到S型病菌的存在。
在这个实验所用的病菌中,无活性的S型病菌是III型的,有活性的R型病菌是从II型中提取的,而在死鼠身上检验到的有毒病菌的外壳与III型一样。这说明无活性的S型病菌的一部分物质促使有活性的R型病菌转化为S型病菌,因而能够合成胶囊多糖具有了毒性。
已死亡的病菌中的参与转化的那一部分物质称之为转化物。借助细胞分离机制、技术的发展,我们能够从无活性的S型病菌中提取出来的提取物在感染动物前加入到R型病菌中去。在1944年Avery和他的同事们的实验表明转移物的化学组成实际上就是脱氧核糖核酸(DNA)。
DNA的发现其意义是巨大深远的:虽然很久以前人们就认识到DNA是真核生物染色体的重要和通用的遗传物质组成部分, 但并不认为DNA也存在于肺炎球菌属的细菌中,同时也统一了人们在对细菌以及其它高级别生物体的遗传上的认识。
图1.2 DNA是转化的原理
对于实验的结果在原文中这样分析到:“从化学、物理性质上分析,诱导物可能就是一种具有高聚合性和粘性的DNA。从另一个方面来看,III性的毒性多糖主要含无氮多糖,其合成受诱导物激发......如此我们就可以证明诱导物及其依次的产物在化学性质和生理作用上是截然不同的,专一的,而且在决定它们所控制的细胞部分的类型上是不可缺少的。”
这一段分析介绍了遗传物质与其表达产物的区别,也为后来的研究奠定了重要的理论基础。
认识到转移物是DNA后,接下来一步我们需要去证实DNA能在完全不同的体系中提供遗传信息。病毒噬菌体T2能够感染大肠杆菌。当把噬菌体微粒加入大肠杆菌中后,它们吸附在大肠杆菌的表面,把其体内的部分物质注入到大肠杆菌内部,大约20分钟后大肠杆菌就会破裂,释放出大量的子代噬菌体的颗粒。
1952年,Hershey和Chase用放射性元素分别标定两组噬菌体:一组用32P标定其DNA,一组用35S标定蛋白质,然后分别感染大肠杆菌。图1.3就表示了这个试验的过程及结果。
将感染后的大肠杆菌搅拌均匀离心分离得到两部分:一部分含有从大肠杆菌表面剥落的噬菌体空壳,这一部分主要由被35S标定的蛋白质组成;另一部分则只有被感染的大肠杆菌。
检测结果表明,大部分放射性32P存在于被感染的大肠杆菌内。产生的子代噬菌体颗粒含约30%的32P。相反在子代噬菌体颗粒中含有很少的——不到1%的35S。这个试验直接表明母体噬菌体的DNA进入大肠杆菌体内并成为子代噬菌体的一部分,而这正反映了遗传物质进行遗传活动的模式。
图1.3 T2噬菌体的遗传物质是DNA
噬菌体(或病毒)能够利用宿主的组织复制自己。噬菌体的遗传物质与细胞基因组的性质相似:能够精确复制,服从相同的遗传规律。噬菌体T2的这种性质更有力的证明:无论是细胞还是病毒,其遗传物质都是DNA。
当DNA加入到某种在培养基中培养的真核单细胞生物群落中,核酸就会进入到细胞中去,其中有一部分就会合成出一些新的蛋白质。早些时候是用提取的DNA混合物试验,现在我们可以利用纯化的DNA使之与寄主细胞融合并产生特异的蛋白质。图1.4表示的就是一个标准实验。
图1.4真核细胞获得新的表型是加入DNA转染使的结果
虽然由于历史原因,人们把利用真核细胞做的试验称之为转染,认为与细菌的转化是相似的。DNA被导入受体细胞中后,便成为受体细胞的一部分,与其他部分按相同的方式遗传。导入DNA的表达将使细胞产生一些新的特性(图示中是胸腺嘧啶核苷激酶的合成)。初期这些试验仅仅在那些培养基中培养的单细胞中获得了成功。到目前,人类已经成功的通过显微注射技术将DNA导入老鼠的受精卵并使之成为鼠遗传物质的组成部分,稳定的遗传。(详细内容见第17章)
这些实验直接说明DNA不仅是真核生物的遗传物质,而且能够在不同物种间相互转移并保持功能活性。
DNA是目前所知的所有有机体以及许多病毒的遗传物质。当然,有一些病毒使用另一种核酸——核糖核酸(RNA)——作为遗传物质。其化学组成结构与DNA只是略有不同,在生命体中起着相同的作用。由此可见,遗传物质的本质就是核酸,实际上,除了病毒是RNA外都是DNA。
DNA的双螺旋结构
核酸分子是由多聚核苷酸链组成的。图1.5说明核酸键的骨架是由一系列可变的异戊糖(环形五碳糖)和磷酸酯基团组成的。一个嘌呤或嘧啶的含氮碱基与糖基相连。DNA是根据它的糖(2-脱氧核糖);RNA的命名是因为糖(核糖)。区别就是在RNA五碳糖2号位上含有OH基。
图1.5 多核糖键是由一系列5’—3’糖-磷酸键作为主链和含有碱基突出组成的
核酸分子有四种碱基:两种嘌呤——鸟嘌呤和腺嘌呤,在RNA和DNA中都存在。在DNA中两种嘧啶分别是胞嘧啶和胸腺嘧啶,在RNA中胸腺嘧啶被尿嘧啶替代。尿嘧啶与胸腺嘧啶结构很相似,只是在C5的位置上有一个甲基的区别。这些碱基常用它们开头字母来代表,在DNA中含A、G、C、T,而在RNA中则有A、G、C、U。
碱基利用嘧啶环上的N1、嘌呤环上N9与戊糖环1位上的碳原子形成糖苷键与戊糖相连。为了避免混淆杂环与糖环上的编号,戊糖环上C位常加(’)以区别。
其中一个戊糖的C5通过磷酸脂基与另一个戊糖上的C3相连(如图1.5所示),如此5’-3’磷酸双脂键便形成了糖基-磷酸脂基主链,而碱基则从主链“伸出去”。
在核苷酸链一末端有一个自由的5’基团,而另一端则存在一个自由的3’基团。为了方便认读,通常按5’—3’的顺序记录,即5’端在左,3’端在右。
观察表明不同物种DNA中各种碱基的含量不同,这就是人想到:碱基序列正是遗传信息的载体形式。到二十世纪五十年代,遗传信息的概念已经被人们广泛的认同,但同时也提出了两个新的课题:一个是DNA的结构;另一个是碱基序列是如何编码蛋白质的氨基酸序列的。
1953年,基于当时三个方面的发现,Watson和Crick提出了双螺旋模型。三个方面的发现是:
X光衍射实验数据表明DNA是一种规则螺旋结构:每3.4nm旋转一周,直径约为2nm。因为相邻核苷酸距离为0.34nm,因此每圈有10个核苷酸单位。
DNA密度测量说明这种螺旋结构应有两条链。而且如果两条链间的碱基都是朝里而且严格的按嘌呤对嘧啶排列,那么就可以阻止嘌呤对嘌呤(太粗),嘧啶对嘧啶(太细)的形成。
不论碱基数目多少,G的含量总是与C一样,而A与T 也是一样。因此通常以G+C的含量来描述DNA的组成。不同物种G+C的含量一般在26~74%。
图1.6 双螺旋键维护不变的宽度,因为嘌呤总与嘧啶遵循A-T,G-C
Watson和Crick认为DNA中两条核苷酸链是以碱基间的氢键相连的。G只与C特异性的以氢键相接,而A则只与T相作用。这种反应称之为碱基互补配对,而配对的碱基则被称之为互补(A与T,G与C)。
图1.7 平面配对的碱基位于垂直于糖—磷基主链
在这种模型中,两条核苷酸链是反向的(反平行),如图1.6描述的。沿着螺旋旋转方向,一条是5’-3’方向,而另一条是3’-5’方向。
糖基-磷酸脂基构成的主链暴露在外表面,并带有磷酸脂基的负电荷。当DNA处于体外溶液时,电荷被一些能与之结合的金属离子,一般是Na+,所中和;而在活体内,则是由带正电荷的蛋白质提供中和电荷。这些蛋白质在决定DNA的内型上起着很重要的作用。
碱基处于双螺旋结构的内部,它们是平面结构,垂直于螺旋轴成对排列。双螺旋体类似于盘旋的楼梯:碱基对如同踏板,就如图1.7所示。顺着螺旋,碱基一个堆一个,像一叠盘子。
图 1.8 DNA的双链构成双螺旋
每个碱基相对于其相邻的碱基对都绕螺旋轴旋转约36度。这样约10个碱基对就能旋转一周。双螺旋体中的两条链彼此环绕形成一条窄沟(约12nm宽)和一条宽沟(约22nm宽),这两条沟在电镜下形状见图1.8。双链是沿右手方向的;即顺时针方向转动。所有这些都是B-DNA所具有的特征。
DNA的复制是半保留的
遗传信息的一个重要特征就是能精确复制。因为DNA的两条链是由氢键连接因此开链时不存在共价键的断裂。由于碱基对的专一性结合,DNA的分开的两条链都能作为母链为互补的子链的合成的模板,复制过程见图1.9。就有一条母链连接一条新链,其中新链的序列是由母链决定:母链中的A将使子链中相应位置为T,而母链中的G将对应子链中的C等等。
图上部的是母双体,下半部分是利用碱基互补作用产生的两个子双体,母双体(非复制物)中含两条母链。复制就需要两条母链打开分别作为子链合成的模板。子双体含有一条母链和一条新链,其序列与母双体完全相同。如此DNA的结构使得它的序列能稳定的遗传。
图1.9 碱基配对提供了DNA复制的机制
图1.10是从整体上反映一个DNA分子的复制过程。母双体复制形成两个子双体,每个子双体又含一条母链和一条新合成的子链。那么可见母双体中的一条母链就完全的转入了子双体中,这种现象称之为半保留复制。
图中所表示的就是对这种半保留复制的研究实验。如果把有机体放入到一个含合适的放射性元素(如15N)的介质中培养,则在母双体DNA中就含有“重”原子,而该有机物在正常介质中的复制物只含有“轻”原子同位素。
母体DNA中有两条含重原子的链(红色表示),在轻原子介质中培养一代后,子代的DNA是一种“杂合体”——包括一条含重原子的母链(红色)和一条含轻原子的子链(蓝色)。在二代中,杂合双体的两条链重又分开,各与一条含轻原子的互补链结合,这样有一半是杂合双体,另一半只含含有轻原子链的双链(都是蓝链)。
图1.10 DNA的复制是半保留的
不管是杂合双体还是纯合双体,其中任何一条链要么是含重原子的要么是含轻原子的。1958年的Meselson-Stahl实验证实了这一观点,在这个实验中观察了三代酵母菌的DNA复制。从细胞中提取出DNA,离心测量其密度,则DNA按密度分成三带:最重的是母体,杂合体是第一代,第二代中一半是杂合体一半是纯合双体。
DNA复制过程中很重要的一步是开链。虽然两条母链必须打开,但它们从不以单链形式存在。双链结构的打开是很短暂的,很快它们就与形成的子链重又环绕成双链结构。因此在任意时刻只有一小部分DNA失去双链结构。
图1.11显示了DNA分子复制的杂和结构。非复制区是母双体,而打开的双链部分是子双体的复制区。母双体在两个复制区间的位置打开,该区域被称之为复制叉。在整个复制过程中,复制叉沿着母双体不断运动。整个复制过程实际上就是持续的母双体解旋与子双体复旋。
图1.11 复制叉是含从解旋的母双链转变新复
制的子双链的DNA区域
核酸是在特定的酶的催化下合成的,这些酶能够识别催化模板,并催化亚基加到正在合成的多核苷酸链上。这些酶根据它们所催化合成的核酸链来命名:DNA合成酶和RNA合成酶。
核酸的降解也是在特定的酶催化下进行的:脱氧核糖核酸酶(DNAase)降解DNA,核糖核酸酶(RNAase)降解RNA。核酸酶通常可分为核酸外切酶和核酸内切酶。核酸内切酶能切割DNA或RNA内的特定的核苷键,产生分离的核酸片段。这属于切割反应。核酸外切酶每次从分子末端移走一个残基,产生单核苷酸,这属于修整反应。
核酸碱基配对杂交
双链解旋的一个重要性质就是在不破坏共价建的情况下解旋。使得在生理条件下高速的条件下解旋和复旋而保持遗传功能成为可能。
图1.12 碱基配对发生在DNA双螺旋链也存
在于单链RNA(或DNA)分子内或分子间的反应
在核酸中,碱基互补配对原则是各种过程的核心。碱基对的分裂是双链分子的一个功能,同时形成碱基对的的能力也是单链核酸活性中不可缺的。图1.12描述了维持双螺旋的分子间碱基配对或复制聚合成二倍体或单链核酸分子自我互补形成双键结构都是相同的碱基互补机制。单链分子上互补的序列按照碱基互补形成分子间的双链结构一个单链核酸与另一个独立的单链核酸的互补单链的碱基互补并不严格局限于DNA—DNA或RNA—RNA,同时在DNA和 RNA分子间也可以发生。
互补链间不存在共价键,使体外操纵DNA成为可能。维持双键的非共价力,可以用加热或暴露于低盐溶液中破坏。当它们之间的氢键全部打开后双螺旋的两条链也完全分开。
链解开的过程称为变性或(俗称)熔解。(变性也用来描述蛋白质真实结构的失去;变性一般是高分子自然结构改变成另一种形式。)
图1.13 变性的DNA单链可复性为双螺旋
DNA的变性发生在一个很窄的温度范围,而且由它不同物理性质有很明显的改变。DNA分离变性的温度范围的中点温度称为熔解温度(Tm).它是由G•C碱基对的比例决定的。因为每个G•C碱基间有三个氢键,比只有两个氢键的A•T碱基对稳定。DNA中G•C碱基对越多,使它解旋需要的能量就越多。在近似生理条件下,含有40%G•C 的DNA——哺乳动物基因组的典型比例——的变性熔解温度大约为87°C。因此,排除细胞组织系统的干扰,在细胞温度下双链DNA占优势。
核酸序列可以用相似性和互补性来衡量.
• 两个核酸序列之间的相似性是指相同碱基(单链序列)或碱基对(双链序列)的比例。比如基因间的比较可以用这种方法,但要求先直接确定基因的真实碱基序列。
• 互补性由A•T和G•C碱基配对规则所决定.在完全配对的双螺旋结构中,双链精确互补.如果我们相互比较两个不同但相关的双链分子,第一个分子的每一单链同另一分子对应单链相同,与另一单链(部分)互补。互补性可以直接通过两个单链核酸相互碱基配对能力来衡量。如双链分子变性成为单链,单链的互补性表示原双螺旋结构的互补性。
测量互补性可行是因为变性在合适条件下是可逆过程.两条解离的互补单链恢复成为原双螺旋结构的过程称为复性。图1.13描述了这一过程。
复性依赖互补链之间的特定碱基配对。反应分两个阶段。第一阶段DNA单链分子随机与另一个单链分子在溶液中相遇;如果序列互补,两个单链配对形成短的双螺旋区。然后碱基配对区沿分子扩展,在拉链式作用的作用下,形成长双螺旋分子。复性时可以恢复变性中丧失的原有性质。
图1.14 过滤器杂交来确定含变性DNA(或RNA)的中溶液中的单链是否含有与固定在过滤器中的单链互补
复性指两条在变性过程中分开的互补链之间的反应。但这种技术可以扩展,允许任何两条互补的核酸序列互相淬火形成双螺旋结构。涉及来源不同的核酸序列的过程通常被称为杂交,如一条来自DNA,一条来自RNA的情况。两个核酸序列相互杂交的能力提供了一个精确测量互补性的方法,因为只有互补碱基序列才能形成双螺旋结构。
杂交反应的方法是将两个单链核酸制品合在一起,并测量形成的双螺旋结构的数目。
图1.14描述了如下过程:DNA变性时单链被吸附至滤膜, 然后添加另一失活的DNA(或RNA), 新添单链仅当它能与被吸附的DNA碱基配对时才被吸收。通常程序是添加一带有放射性标记的DNA或RNA分子到滤膜,由被滤膜固定的放射性标记量来衡量反应程度。
两单链核酸之间的杂交程度由它们之间的互补程度决定。两个序列不需要完全互补杂交,如果非常接近但非完全相同,可以在不互补的片段处, 碱基不配对,形成不完全的双螺旋结构。
突变改变DNA顺序
突变为 DNA是遗传物质的观点提供了决定性是证据。DNA序列的改变导致蛋白质序列的改变,由此可以得出DNA编码蛋白质的结论。更进一步,根据有机体的表现型的改变,我们可以判定蛋白质的作用。基因中不同突变的存在使得可以对多种形式的蛋白质进行比较,通过更详细的分析,可以判定蛋白质作为酶或其它功能的范围。
正常细胞过程或与环境随机接触使所有生物发生一定数量的突变,称为自发突变。不同物种自发突变的发生有一定的特征几率,称为背景水平。突变属于小概率事件,并且在进化过程中,有害突变遭到选择淘汰。因此,从自然种群获得大量自发突变以供研究是很困难的。
用适当的化合物,可以增加突变的发生。这样的化合物称为诱导剂,这样的突变称为诱导突变。大多数突变试剂通过修饰特定碱基或并入核酸而直接反应。一个诱导剂的效率是由在背景水平上突变速率的增加的程度来判断的。用突变试剂可以改变任何一个基因。
DNA任何一个碱基对都会发生突变。一个点突变只改变一个碱基对,它可以发生在如下两种情况:
对DNA直接改变一个碱基的化学修饰。
DNA复制过程中的功能失常导致错误碱基在DNA合成时插入多核苷酸链。
根据一个碱基取代另一个碱基时变化的性质,可以把点突变分成两类:
最常见的一类是转换,包括一个嘧啶被另一个嘧啶替代,或一个嘌呤被另一个嘌呤替代;这样一个G•C对被换成A•T对。反之亦然。
图1.15 突变可以是用化学诱导法改变一个碱基得到
比较少的一类是颠换,在此过程中,一个嘌呤为一个嘧啶所取代,反之亦然,即一个A•T对变成一个T•A或C•G对。
在亚硝酸的作用下,一个碱基发生化学反应转化成另一个碱基,是转换的典型例子。如图1.15所示,亚硝酸作为氧化脱氨基试剂将胞嘧啶转化为脲嘧啶。在转换以后的复制循环中,将会有一个A与U配对,代替G与原来的C配对。这样,在下一次复制循环中,A与T配对使原来的C•G对为T•A所取代。亚硝基还能使腺嘌呤脱氨基,使A•T对逆转为G•C对。
当异常的碱基对违背通常的Watson-Crick配对原则时,碱基转换也由碱基误配产生。碱基误配通常由异常碱基的引入所引起。
图1.16 突变可以从向DNA引入碱基的相似物产生
一些诱导剂是正常碱基的类似物,具有含糊的配对性质。它们混入DNA并取代一个正常的碱基,导致突变反应。如图1.16所示,胸腺嘧啶的甲基被溴原子取代,就成了其相似物溴脲嘧啶(BraU)。溴脲嘧啶混入DNA,取代胸腺嘧啶。但它具有不确定的配对性质,这是因为溴原子使碱基发生酮式与烯醇式间的转换。烯醇式能与鸟嘌呤配对,导致A•T对被G•C对所取代。
碱基在最初的混合或其后的复制循环中都会发生误配。在每次复制循环中都有几种可能诱发碱基转换,因此,溴代脲嘧啶的混入对DNA序列具有持续影响。
碱基取代诱发的突变通常有漏洞:突变型还残留一定的功能。这种情况发生在DNA序列改变而相应的蛋白质活性不会完全消失的时候。
长期以来,点突变被认为是单个基因改变的基本方式。然而现在我们知道,用额外成分插入一段基因也是经常的。插入成分来源于转座因子,即可以从一个位置移到另一个位置的DNA序列。(我们将在15章和16章讨论这种成分。)插入通常使基因的活性完全丧失。在插入处,部分或全部插入材料以及一些临近片段的缺失随后发生。
点突变和插入/缺失的一个重要区别是,突变剂可以提高点突变的频率,却对“可移成分”导致的突变毫无作用。而且,插入和缺失可通过其它机制发生——例如,复制或重组过程中的错误或基因交换——虽然它们可能更少见。由称为丫啶类的一类的诱导剂引入插入和缺失(很少的一部分)。
不同的回复性是区别点突变、插入与缺失的重要特征:
点突变可以通过重建原序列或在基因的其它部位进行一次互补突变得以回复。
插入可以通过缺失插入成分得以回复。
缺失不可回复。
其它基因也可能发生突变以阻遏原基因突变的影响。这种作用称为抑制,或更常用的相互顺反抑制。一个突变转座子阻遏另一个转座子的突变作用叫做抑制基因。
突变集中在突变热点上
上面我们讨论了单独改变DNA序列对基因单位活性的影响。在我们以突变对基因的活性影响的观点来考虑时,一个物种的基因或多或少表现为大小相似,其突变几率也相似。这表明基因可以看作是突变的靶子,并且任何碱基对的改变,都会破坏基因的功能。这样一来,基因对突变的感受性就近似与其大小成比例。但如果考虑DNA序列里突变发生的位置的话,到底是所有的碱基对都具有相同的感受性呢,还是某些部位比其它部位更易于发生突变呢?
当我们分离同一基因上大量独立的突变时会怎样呢?首先要获得大量发生单一突变的变种,这样每一种突变的位置就可以确定。多数突变发生在不同的位置上,但有些则发生在同一位置。发生在同一位置上的两个独立隔绝的突变,在DNA上可能恰好有一样的变化(这种情况是因为同一突变发生在不同的条件下),或者可能导致DNA发生不同的变化(同一碱基对可以有三种不同的点突变)。
图1.17 自发突变遍及于大肠杆菌的lacl基因,但是集中在突变热点上。
图1.17的图形表示大肠杆菌乳糖酶Ⅱ基因各碱基对的突变频率。随机碰撞动力学给出了一个特定位点发生多个突变的统计概率(见图示位置分布)。即有些位置可以发生数个突变,有的则不发生。但事实上有些位点突变的次数远远高于随机碰撞的预期值,可以比随机碰撞的预期值高出十倍甚至一百倍。这些位点称为“突变热点”。自发突变可能发生在突变热点,不同突变剂也有其各自的突变热点。
大肠杆菌的自发突变的一个主要原因是DNA中一个异常碱基的出现。DNA复制时,除四个常见碱基插进DNA之外,有时会有“修饰碱基”混入。顾名思义,这些碱基是由DNA中四个常见碱基之一经化学修饰得到的。最常见的修饰碱基是5-甲基胞嘧啶,由甲基化酶将一个甲基加到一小部分胞嘧啶上(DNA的一些特定位点)而产生。
含5-甲基胞嘧啶的位点已证实为自发突变的突变热点。每次突变,G•C对就转换为A•T对。在大肠杆菌中,不发生甲基化的DNA链就没有突变热点。
突变热点的成因是5-甲基胞嘧啶经常发生脱氨基反应。羰基取代氨基使5-甲基胞嘧啶变成胸腺嘧啶,图1.18分析了为什么(稀有的)5-甲基胞嘧啶脱氨基会诱发突变,而更常见的胞嘧啶脱氨基却不会。
胞嘧啶脱氨基生成脲嘧啶,而大肠杆菌含有一种脲嘧啶—DNA—糖苷酶,它能将脲嘧啶残基从DNA里除去。反应结果留下未配对的G残基,接着,“修复系统”便会将一个C碱基插入与之配对。反应的最终结果是原DNA的序列将得以保留。也许这套系统正是用来保护DNA以抵抗经常发生的自发的胞嘧啶脱氨基反应。(虽然它没有足够的活性以抵抗亚硝酸的作用,见图1.15)
但5-甲基胞嘧啶脱氨基留下来了。胸腺嘧啶这个碱基是DNA本身所具有的成分,系统无法识别这样的变化,最终发生了突变。这个转化生成一个误配的G•T对,在随后的复制中两者分离,产生一个野生型的G•C对和突变型的A•T对。
图1.18 5-甲基包嘧啶脱氨基生成胸腺嘧啶
(使得G•C对转换成A•T对)。然而,包
嘧啶脱氨基却生成尿嘧啶(尿嘧啶通常被去除,
然后被包嘧啶取代)。
这套系统的操作过程对比较DNA中用T碱基而RNA中用U有所启发。或许它与DNA对序列稳定性的要求有关:T的使用意味着C脱氨基可以立即被识别出来,因为它们产生U碱基在DNA里不常见。
使基因失活的自发突变按每个座位每代~10-5—10-6的速率进行。这种突变速率对应的单个核苷酸变化速率为10-9—10-12次/代。我们还没有精确测定真核生物突变的速率,虽然通常认为它与每个座位对应一个基因的细菌相似。点突变占自发突变的多大比例也属未知数。
并不是每个DNA突变都会导致表现型发生可以检测到的变化。不表现作用的突变称为“静突变”,它可以分为两类。一类是DNA碱基的变化不改变其所编码蛋白质的氨基酸序列;另一类改变了蛋白质的氨基酸,但氨基酸的变化并不影响蛋白质的活性,这种情况称为“中性取代”。
使基因失活的突变称为“前进突变”,其逆效应为“后退突变”,它有两种类型。
一个突变精确的逆转为原基因,称为“真反转”。这样,如果一个A•T对为G•C对所取代,使之回复为A•T对的另一个突变就能精确的再生一个野生型。
另一种类型是发生在基因其它部位的第二个突变,恰好抵消了第一个突变的作用,称为“二次反转”。例如蛋白质一个氨基酸变化使其失去遗传功能,但第二个氨基酸变化恰好抵消了第一个变化的作用,使蛋白质复活。
前进突变是任何一个是基因失活的改变,而倒退突变则要恢复被特定前进突变破坏的蛋白质的功能。因此,要求倒退突变具有高的多的特异性。倒退突变的速率也相应要低得多,通常相差10倍左右。
顺反子是单条的DNA链
第一次系统的尝试使基因和酶联系起来表明了:新陈代谢路径的每一个阶段都被单一的一种酶催化,也可以被不同基因里的突变阻断。这导致了“一个基因一个酶”的学说。它认为每一个代谢反应均由一种酶催化,而这种酶是由一个特定基因产生的。一个基因的变异就改变了它所负责的蛋白质活动。
鉴定哪个蛋白质代表哪个基因是一个漫长的工作。产生孟德尔的皱豌豆的变异的原因直到1990年才被发现是由一种淀粉分支酶的基因的不表达引起的。
对整个基因结构来说,变异是随机发生的,最大的可能性是对基因功能的损坏甚至摧毁。这就解释了隐性变异的本质:它们代表了功能的缺失,因为变异基因的酶的产生被阻止了。图1.19显示了野生型等位基因对隐性等位基因的显性优势。当一个杂合子有一个野生型的等位基因和变异的等位基因时,野生型等位基因控制了酶的产生,从而是显性。(这是假设单个野生型等位基因产生了足够的酶,当单一的酶不足时,两种基因产生的不等量的酶产生了杂合子中的部分显性的表现型。)
图1.19 蛋白质的基因位点;显性可以用突变的蛋白质的肽键解释。一个隐性的等位基因队表现型没有贡献,因为它不产生蛋白质(或产生没有功能的蛋白质)。
这种学说在解释由亚基组成的蛋白质时需要修正。当亚基相同时,蛋白质叫同多聚体,由一个基因代表;当亚基不同时,蛋白质叫异多聚体。要作为一个更全面适用于所有异多聚体蛋白质的理论,一个基因一个蛋白质的学说可以更精确的表示为一个基因一个多肽链。
我们怎样确定位于同一个基因中的两个突变是否产生了相似的表现型。如果他们在基因图中相距很近时,它们可以组成等位基因。然而,它们也可能是不同基因中的,只是它们产生的蛋白质具有同样的功能。互补实验就是用来测定它们是否在同一基因内的。实验要得到两种变异的杂合子(通过交配两种变异体的纯和亲代。)
如果变异在同一基因中,亲代的基因型表示为M1/M1和M2/M2,一个亲代提供M1等位基因,另一个提供M2等位基因,杂合子的基因型为M1/M2。没有野生基因型,所以杂合子具有变异的表现型。如果变异体在不同基因处,亲代的基因型为M1+/M1+和+M2/+M2,每条染色体都有一个基因的野生型拷贝和另一个基因的变异型拷贝,杂合子的基因型则为M1+/+M2。亲代各提供了一个基因的野生型拷贝。杂合子的表现型为野生型,两个基因称为具有互补作用。
图1.20 互补实验可以定义顺反子。图中,基因用条块标注,红色的星标注了基因突变的点。
图1.20提供了互补实验的更精细的描述,实验的基本组成如图的上部分所示。如果两个突变在同一个基因里,我们将看到反势和顺势有不同的表现型。反势是变异体,因为每个等位基因都有一个(不同的)突变体。但是顺势是野生型,因为一个等位基因有两个突变体,但是另一个没有变异。然而,如果两个突变位于不同的基因里,我们总是能看见野生型的表现型。每一个基因里总有一个野生型和一个变异型,和构型是没有关系的。
当两个反式的变异不能互补时,我们推论得两者影响同一个功能,所以它们被归入同一互补组。我们认为一个互补组就是一种分立的基因单位,这种单位的学名叫顺反子。一个顺反子实际上就等于一个基因。基本地,这三个名次都是在描述DNA的一条链,它的功能是作为RNA和蛋白质起源的单位。
只有不同基因能互补的规则也有例外,就是当该基因产生的多肽链是同多聚体的亚基时。在野生型细胞中,活性蛋白质有几个相同的亚基组成,但当一个细胞有两个变异的等位基因时它们的产物以两种不同的亚基聚成蛋白质。两种变异可能有补偿作用,即是单种变异的蛋白质是无活性的。两种变异组成的蛋白质可以是活性的。这种作用叫做等位基因间互补作用。
复等位基因的本质
当一个基因被确定时,理论上就利用产生完全缺失这个基因的生物来决定它的功能。基因突变导致完全失去基因功能,往往是因为整个基因的缺失,叫零突变。如果这个基因很重要,那么零突变将是致命的。
要决定一个基因对于表现型是否或者有什么样的效果,就要对零突变进行研究。当一个突变不能影响表现型时,很可能是有漏隙——有足够的产物来维持功能,即使它的量小于或不等于野生型。但是如果一个零突变不影响表现型,我们可以下结论说这个基因不是必需的。
零突变和其他阻碍功能的突变(不一定要杀死生物)都叫做功能缺失型突变,它是隐性的。如图1.19所示。有时突变有反向作用,使蛋白质具有了新的功能,这种突变叫功能获得型突变,它是显性的。
如果基因里每个阻止活性蛋白生成的变化都产生一个隐性突变,那么在任何一个基因里都会有大量的突变。许多氨基酸的替换可能改变蛋白质的结构,足以阻碍其功能。相同基因里的不同变异叫复等位基因,它们的存在使得在突变的等位基因间组成杂合子成为可能。
这些复等位基因之间的关系有多种情况。
最简单的情况下,野生型基因带有有功能的蛋白质的密码,变异型基因带有无功能的蛋白质的密码。
但变异型的等位基因常有不同的表现型。如黑腹果蝇的白色位点的野生型是正常红眼发展必须的。当基因完全缺失时,使变异的纯合子长出白眼,位点也由此得名。
需要描述野生型或变异型等位基因时,野生型的基因型在位点的名字后加加号(W+是黑腹果蝇红眼的野生型等位基因),有时仅用+表示野生型等位基因。用位点的名字表示变异的等位基因。
完全缺失的基因(或没有表现型)用减号表示。对于不同的变异等位基因产生的不同效果,可用其它的标志,如Wi和Wa。
图1.21 w位点有很多的等位基因的系列。它们的表现型从野生的颜色(红)一直延伸到完全没有色素。
W+的等位基因在杂合子的基因中占显性地位。有很多种变异的等位基因。表1.21显示了一个小例子。虽然有些等位基因没有眼的颜色,许多等位基因产生相同颜色的眼睛。每种变异的等位基因都是基因中的不同变化。它没有完全消灭基因的作用,却有一种积累效应从而产生不同的表现型。这些等位基因是以它们纯合子的眼睛颜色定义的。(大多数等位基因影响眼睛色素的数量。这个范例中以颜色递减的顺序排列变异,但有些变异,如Wsp,是影响色素沉淀的方式)
当复等位基因存在时,一个个体也许是两种等位基因的杂合子。这个杂合子的表现型取决于每个等位基因对沉淀作用的影响。两个变异等位基因之间的关系与变异等位基因和野生型等位基因的关系一样,一个等位基因也许是显性,也许有部分显性,也许有等显性。
并不需要在任何位点都有一个野生型的等位基因。人类血液系统提供了一个范例:零突变O型血没有蛋白质功能,但有功能A型和B 型是等显性的。在图1.22中表示了这种关系。
图1.22 ABO位点携带密码,生成半乳糖基转
移酶。半乳糖基转移酶的特异性决定了血型。
O(或H)抗原在任何个体中都产生,由特定的碳水化合物基团与蛋白质结合而成。ABO位点携带密码,生成半乳糖基转移酶,O抗原再加一个糖基。这种酶的特异性决定了血型。A型等位基因产生辅助因子UDP—N—乙酰半乳糖,产生A抗原。B型UDP—半乳糖,产生B抗原。A和B的转化酶有四个氨基酸不同,所以辅助因子的作用也不同。O型有一个没有这种功能的变异(一个小的删除),未加工的O型抗原就产生了。
这就解释了A和B等位基因在AO和BO杂合子中的显性,与之相应的转化酶产生了A或B抗原。在AB型杂合子中A和B等位基因等显性。因为两种转化酶都起了作用。OO纯合子没有功能,所以没有以上两种抗体。
A或B都不能被认为是野生型。因为它们代表可互换的作用,而不是功能的获得或缺失。在一个种群中有多种有功能的等位基因时,被称为多态性。(参见第三章)
遗传密码-三联体
每个基因代表一个特定的多肽链。在1950年,Sanger 通过研究胰岛素的特性提出了一个蛋白质由特定的连续的氨基酸组成。基因由DNA组成这个发现呈现给世人,同时引起了对DNA的中核苷酸的顺序怎样代表蛋白质中氨基酸的顺序而进行讨论。
一般DNA的结构中最重要的特点是核苷酸是由有独立的特定的顺序的成分组成的。DNA中核苷酸的顺序之所以那么重要不是因为每个的结构,而是因为它指定了氨基酸顺序的遗传密码来构成相应的多肽。与DNA顺序及相应蛋白质顺序密切相关的叫遗传密码。
每一个蛋白质的结构和酶活性都是由它最主要的氨基酸序列决定的。由于决定蛋白质中氨基酸的顺序,基因能够携带所有的信息就需要指定的活性多肽链。这样一来,一个单一的结构-基因-就能用无数种多肽形式来表现自己。
总体来说,一个细胞的不同蛋白质产物承担了催化作用和结构活动,来完成它们建造自己表型的责任。当然,除了翻译蛋白质的基因序列,DNA也含有确定的序列,序列的功能就是能被调节分子识别,这种分子一般是蛋白质。在这里,DNA的序列直接的决定了它的功能,并没有通过中介的密码。两种不同形式的片断,基因表达就如同蛋白质和序列的识别,组成了遗传信息。
遗传密码通过复杂的机制由核酸翻译成蛋白质,只要DNA所携带的信息有意义,这样的机制就必然存在。在任何以知基因片段中,DNA双链只有一条用来编码蛋白质,因此,人们通过碱基序列(甚至不是碱基对)来记遗传密码。
遗传密码中,每三个核苷酸编码一个氨基酸,称为密码子。一个基因包含许多密码子,这些密码子从一端的起始点到另一端的终点按顺序排列。按传统的3’-5’方向书写的核苷酸顺序,对应蛋白质从N末端到C末端书写的氨基酸顺序。
基因是从特定起始位点开始,按不重叠的三联体方式读码的:
不重叠意味这每个密码子包含三个核苷酸,即一个完整的核苷酸三联体表达一个完整的密码子。
特定起始位点意味这蛋白质的合成必须由一端顺序进行到另一端,因此不同部分的编码序列不能分别解读。
密码的特性预见了两种不同形式的异变物会有不同的影响。如果一个特定的序列被另一个序列解读,比如:
UUU AAA GGG CCC (密码)
aa1 aa2 aa3 aa4 (氨基酸)
所以,一个突变点只能影响一个氨基酸。举个例子,A用其他的碱基(X)代替,引起了aa2被aa5取代:
UUU AAX GGG CCC
aa1 aa5 aa3 aa4
是因为只是改变了第二个密码。
但是突变要是插入或者删除一个单个的碱基将使它的阅读框架从突变开始所有的序列都发生改变。这种变化被称为移码。一个核苷酸的增加可能是以这种形式发生:
UUU AAX AGG GCC C
aa1 aa5 aa6 aa7
因为新的三联体顺序已经完全不同于旧的了,蛋白质的所有氨基酸顺序从突变点开始往后都将被改变。所以蛋白质的结构功能很可能全部的丢失。
移码突变由呀啶类试剂所引起,它与DNA结合,扭曲双螺旋结构,导致复制时核苷酸插入或缺少,从而诱导移码突变。呀啶类试剂导致的每一次基因突变,结果都是插入或者缺少一个碱基对。
如果一个呀啶突变体的产生是由核苷酸的增加,那它可以通过删除核苷酸来恢复到野生型。但这个逆反应也可能是临近碱基对的缺失。这两种突变的结合,提供了有关遗传密码本质的证据。
图1.25结构变异展示了遗传密码在三联体中从一个固定
的起始点被阅读。
图1.25描述了移码突变的特征。插入或缺失一个碱基改变了蛋白质突变位点后的整个序列。但如果一个插入和一个缺失同时发生,则只有两个突变位点之间的密码阅读框架出错;第二个突变位点后又恢复正确读码。
最初的分析用基因方进行。所有呀啶类试剂诱发的突变可分成两类,用(+)和(-)表示。每一类型的突变自身都导致移码,(+)增加一个碱基,(-)型则除去一个碱基。双突变结合(++)型和(--)仍显示为突变型。但(+-)型或(-+)型的结合则互相抑制,我们称其中一个为另一个的抑制因素(本文中“抑制因素”用的不是本意,见下文)。这个结果表明遗传密码是由特定起始位点开始按一定阅读框架解读的,因此插入和缺失可以互相抵消,而双插入或双缺失仍保持变异。但这仍未说明多少个核苷酸组成一个密码子。
当发生三突变时,仅有(+++)型和(---)型显示为野生型,而其他的组合则显示为变异。如果增加或者减少三个碱基恰好增加或减少一个氨基酸,这意味着遗传密码是按三联体解读的。在两个外侧突变点之间发生了氨基酸错序,而两侧的氨基酸顺序仍为野生型,如图1.25。
如果遗传密码按不重叠的三联体方式解读,那么,把一个核苷酸序列翻译成蛋白质将会有决定于起始位点的三种不同解读方式,称为阅读框架。对核苷酸序列:
A C G A C G A C G A C G A C G A C G
三个可能的阅读框架为:
ACG ACG ACG ACG ACG ACG
CGA CGA CGA CGA CGA CGA
GAC GAC GAC GAC GAC GAC
一个阅读框架组成了特定的三联体所代表的氨基酸叫一个畅通的阅读框架或者ORF。一个转入蛋白质的序列要有一个阅读框架,由一个起始密码(AUG)开始并沿着一套连续的代表氨基酸的三联体直接由三个终止密码(见第五章)中的一种来结束。
一个阅读框架不能被解读成蛋白质是一般是因为终止密码的阻断。如果一个序列被三种阅读框架阻断,它就没有翻译蛋白的功能了。
图1.26一个通畅的阅读框架由AUG开始并在三联体中继续直到遇到一个终止密码。阻断的阅读框架可能时常的被终止密码阻断。
当一个DNA区域的序列获得了一个新的功能结构,每一个阅读框架被分析后决定是否通畅还是阻断。一般在一个单个易伸缩得DNA中仅仅是三种阅读框架中的一种被开通。图1.26展现了一个例子,一种序列只能被一种阅读框架解读,如果阅读框架做二选一的运动就通常被终止密码阻断。一个长的通常的阅读框架不是偶然存在的,如果它不能被翻译成蛋白质,将有选择的阻止终止密码的堆积,所以长的通畅的阅读框架被识别首先的证据就是在框架中序列被翻译成蛋白质。一个通畅的阅读框架(ORF)不能确定任何蛋白产物,这种框架一般叫做不确定阅读框架(URF)。
原核生物的基因和蛋白是共线性的
把一个基因的核苷酸序列和一个蛋白的氨基酸序列来做比较,我们可以直接得出是否这个基因和蛋白是共线性的:是否基因中的核苷酸序列恰好与蛋白质中的氨基酸序列相符合。在细菌和它们的病毒中,有一个确切的等价物。每个基因包含一个连续的直链 DNA ,它的长度直接与它所表达的蛋白质中的氨基酸数目有关,按照基因编码,一个3N碱基对要求为一个N氨基酸蛋白编码。
原核基因和它的产物等同性意味着一个DNA限制性图谱和一个蛋白的氨基酸图将很好地吻合,这些图是怎样与重组图相符合呢?
共线性的基因和蛋白首先是在大肠杆菌的色氨酸合成酶基因中进行研究的。基因的距离通过突变之间的重组百分比来衡量。蛋白质的距离则由用来代替的单个氨基酸点来衡量。图1.27比较了这两个图,突变的七个点的顺序与相应的用来代替的氨基酸点是相同的,而且重组距离与实际的蛋白的距离相对相似,重组图扩大了一些突变之间的距离,但否则与真实图来比就没有丝毫差别了。
图1.27色氨酸合成酶基因的重组图与蛋白质基因
的序列是一致的。
重组图显示了另外关于基因组合的两点。不同的突变可能造成野生型的氨基酸被不同的替代物所替代,如果两种突变不能结合,它们一定涉及到了在DNA相同位置上的不同突变点,如果这些突变可以在基因图上得到分离,但却影响上图中同样的氨基酸(图中划线处),它们必须在影响氨基酸的不同位置涉及到点突变。这是因为基因重组单位(实际为1bp)小于氨基酸的编码单位(实际为3bp)。
比较一下基因和蛋白,我们被限制在DNA序列上与蛋白相关的点与点之间。然而,基因并不直接翻译成蛋白,而是通过信使RNA(缩短的小型的mRNA)来表达,一个核酸中间的实际上被用来合成一个蛋白(正如我们在第五部分所看到的),信使RNA通过被用来复制的相同的碱基对来合成,所相当不同之处就在于它仅与DNA双螺旋的一个链相联系,图1.28显示了信使RNA的序列与DNA的一条链完全互补(除了用U代替T)且和另一条链完全相同。习惯上DNA序列写注为5'-3',同于RNA链的写法。
图1.28RNA的合成是要以DNA的一条链为模板来补足碱基对的。
信使RNA包括一个核苷酸序列,它与蛋白质中的氨基酸序列相对应,这部分核酸叫做编码区。但是信使RNA在任何一端包括了附加序列;这些序列并不直接代表蛋白。这个区域叫做5'非编码前导序列和3'尾部非编码区。
基因中包含了代表信使RNA的全部序列,有时在无编码区还发现了妨碍基因突变的功能,从而证实了包含有正常基因这个观点的正确性。
图1.29解释了这种情况,这里基因包含有一个连续的用来制造单个蛋白的DNA链。它既包括了用来编码这个蛋白的序列,又包括了另一条链上编码的序列。
图1.29基因可能比编码蛋白序列长。 图1.30基因的表达是一个多步的过程。
一个基因上升到一个蛋白的过程叫做基因的表达。图1.30表述了它的基本过程。第一步是转录,在一个单链DNA的RNA复制中。 在单个基因(一般在细菌内)这个基因其实就是mRNA。对于真核生物的基因,立即复制的基因叫做一个前mRNA,就是被加工后生成的一种成熟的完善的mRNA。
表达中最重要的一步是RNA的剪接。真核生物(大多数是高等真核生物),许多基因包括内部的不复制成蛋白的区域。剪接的过程去掉了一些前mRNA的区域来产生一种能有连续的阅读框架的RNA(见图2.10)。其它的加工结果发生在这步包括前mRNA的5'端和3'端的修饰(见图5.15)。
RNA的转录和加工发生在细胞核中。下一个基因表达的步骤是把mRNA翻译到蛋白质中。这个发生在细胞质中,所以它需要mRNA的运输通过细胞核膜进入细胞质。
翻译是由一个复杂的器官完成的,这个器官包括蛋白质和RNA两个部分。实际上担任过程的“机器”是核糖体,一个大的复杂的,包括了一些大的RNAs(核糖体RNAs,小型的有rRNAs)和许多小蛋白质。氨基酸的识别过程与一个特殊的核苷酸三联体需要一个中间的转运RNA(缩写为tRNA)是一致的,这里每个氨基酸至少有一种tRNA。许多辅助蛋白是螺旋状的。
在这一步要记下来的最重要的是基因表达的过程有RNA的参与,并不仅仅是酶的作用。但也是在器官的组份中为前提,rRNA和tRNA组份被基因翻译并通过复制(就像mRNA,除非这里没有次要的后来的翻译)的过程产生的。
顺式作用位点和反式作用因子
在3章中顺反式互补试验证明了一个基因一个染色体的观点。在一个蝗虫的二倍体上,它的基因带有两个不同的突变,其作用就在于突变决定了是否有一个功能性的等位基因。如果在一个等位基因上所有的突变都是顺式,则另一个等位基因没有突变,是原生型的,但是如果突变是反式的,则每一个等位基因上有一个突变,两个等位基因都是突变体(图1.20所示),现在我们就展开论述,用未定义基因的密码区时顺式和反式的不同,来讨论一个调整的元素与基因之间的联系。
图1.31 DNA中的控制位点供应了蛋白质的结合位点; 图1.32 一个顺式作用位点只能控制
编码区经由RNA的合成来表示。 邻近的编码区,不能影响其它的等位基因。
假设基因表达能力由密码区附近的接合 DNA 的蛋白所控制,在图1.31描述的例子中,只有当蛋白接合DNA时RNA才能合成,假设现在一个突变发生在了这个蛋白所结合的 DNA序列上,以至于这个蛋白不能再识别这个 DNA。结果,这个 DNA就不再能被表达了。
所以一个基因可以被失活,通过调控位点的突变或编码区的突变。通常,这些突变很难区分,因为它们都是在单个等位基因的DNA序列上发生。因此在顺式一反式试验中它们有相同的性质,因此一个调控点上的突变与密码区突变在定义上是相同的。
图1.32显示了一个调控点的缺失仅仅影响它所联系的密码区,并不影响其它等位基因的表达,一个仅仅影响邻近 DNA序列性质的突变叫顺式型。
我们可以把图1.32中的顺式型突变的行为与编码正常蛋白基因的突变做比较。图1.33显示了正常蛋白的缺失将阻碍所有的等位基因的表达,这种突变则叫做反式。
图1.33 蛋白质中一个反式作用点的突变影响了所有
等位基因的表达。
所不同的是,如果一个突变是反式的,则在一个细胞中作用于多靶细胞的可扩散产物(特别是蛋白)就将产生。但是,如果一个突变是顺式的,则一定是通过临近的DNA 来起作用,就是说它不以RNA或蛋白形式来表达。
基因信息可由DNA或RNA来提供
中心法则定义了分子生物学的样式。基因以核酸的序列长期被保存,但功能在蛋白质的组成形式上被表达了。复制在遗传信息中起着重要的作用。转录和翻译对它从一种形式转化成另一种形式起很重要的作用。
图1.34举例说明了复制,转录,翻译所扮演的角色。从中心法则的观点看:
核酸包括了DNA或者RNA两种遗传材料。细胞只用DNA。一些病毒是用RNA,并且病毒RNA的复制发生在受感染的细胞中。
细胞遗传信息的表达一般是单向的。DNA转录产生RNA分子,这种分子只能被进一步运用来产生蛋白质序列,一般来说,他们不能回复来当作遗传信息重复使用。RNA翻译到蛋白一般是不可逆的。
图1.34 中心法则陈述的是核酸中的遗传信息能被保存
和转运,遗传信息转入蛋白质是不可逆的。
核酸中充满了由可变和不可变所结合的基因材料。通过碱基互补原则可以使基因信息的复制被可靠的遗传,同时偶尔突变的发生使遗传发生了改变,为进化提供了材料。基因密码为蛋白质中基因信息的表达提供条件。
这些机制对于原核生物、真核生物或病毒所携带的信息是同等有效的。所有的活着的有机体的基因是由双螺旋DNA组成,病毒的基因组由DNA 或RNA所组成,并且这有一些关于单链(ss)或者双链(ds)的例子。被用来复制核酸的机制细节在病毒中是多样的,但通过合成互补链来复制的机制则是相同的,正如图1.35所示。
图1.35 不管是单链还是双链的核酸的合成都要遵守
碱基互补原则。
通过半保留复制,细胞基因重新生成DNA,双链病毒基因,无论是DNA 或RNA,都通过利用双链中的单链做为摸板来合成另一条链。
有单链基因组的病毒用单链做为模板合成一个互补链,这个互补链被用来合成它的互补链,当然,与先前的互补链相同。复制可能涉及稳定的双链中间产物的生成或者把双链核酸做为一个过渡态。
DNA到RNA的单项运输的限制是不能绝对的。可能会被回复得含有单链RNA分子的遗传物质的病毒所征服。在感染循环中,RNA被反转录进一个单链DNA的过程改变了。这个双螺旋DNA变成细胞基因组的一部分,并像其它基因一样被遗传下来,所以反转录允许一个RNA序列被回复并且以遗传信息再次使用。
RNA复制和反转录的存在证实了一个原则:核酸序列中任一种形式的信息能改变成另一种形式。然而,一般情况下,细胞更信赖DNA回复,转录,翻译的过程。但是在极少的场合(可能中间涉及了一些RNA病毒),信息从一个细胞RNA被改变进入DNA并且把基因组感染。尽管反转录会扮演执行细胞常规命令的角色,但当我们考虑到基因组的进化时,它变成一个有潜在重要性的机制。
这个原则适用于如植物和两栖类的大的基因组到如支原体的小的基因组甚至到更小的DNA或RNA病毒的基因信息。表1.36总结了一些解释基因种类和大小范围的例子。
图1.36 基因组中核酸的数量已经超过了一个巨大的
范围。
所有的活细胞的 DNA基因组由非常长的分子组成;除了细菌和支原体之外都由一个以上这样的分子组成。有些大的病毒(例如流感病毒),它有片段基因,由一个以上的核酸分子组成,其它的病毒基因组组成了单个的核酸分子,对于小的病毒,(SV40,φX,MS2)还有重叠基因的功能。
在所有生物体范围内,基因不同却有100,000范围上的交叠,一个普通的原则非常重要。DNA编码那些生物体细胞必须合成的蛋白,同时蛋白(直接或间接地)提供了细胞生存所需的功能,基因的总数显很难去估计的(在23章中将会详细讲到一个组织)。最小的生物体,支原体,其基因组的大小仅为病毒的两倍。同样病毒的基因信息也是DNA或RNA,核酸编码了那些用于包裹基因和感染过程中用于重新产生宿主细胞的蛋白(最小的随体烟草坏死病毒就不能被单独复制,必须同时需要一个“帮助”病毒:烟草坏死病毒,它是一个传染性的病毒)。
类病毒是在高等植物中造成疾病的传染性物质,它们是很小的RNA颗粒。不象病毒,它的传染性物质由病毒粒子组成,被蛋白所包蚀的基因,病毒RNA也是传染性物质,病毒粒子只由RNA组成,它是如图1.37所示的象典型标准的碱基,杆状结构的突变使它减少了感染性。
图1.37 马铃薯纺锺体微管病毒的RNA是环形分子,而且有广阔的双链结构,经常被内部的环状物中断。轻链和重链不同就在于它们三个核苷酸替代物。
一个类病毒RNA组成了在宿主细胞上自动复制的分子种类,它的序列被永久性地遗传给了后代,类病毒有许多组,一个病毒因与这组中其它病毒序列相似而被分为一组。例如,四个与马铃薯微管病毒有关的病毒在序列上有70~83%的相似性,特别的病毒链的差异影响到了被感染细胞的表现型。例如,马铃薯纺锺体微管病毒的轻链和重链不同就在于它们三个核苷酸替代物。
病毒和类病毒相似性在于核酸基因序列具有遗传性,从而导致突变,并且决定了表现型,它们充分说明了基因表达的判断准则。然而类病毒和病毒在结构和功能上不同,它们有时被叫做病原体病毒。类病毒RNA并不被转移进入蛋白,于是它就不能编码使它存在的功能。这样就有两个问题要解决,类病毒RNA怎样复制呢?它怎样来影响被感染的细胞的表现型呢?
复制的功能是由宿主细胞的酶执行的,与它们正常的功能不同。病毒序列的遗传性暗示了病毒RNA提供了模板。
病原体因干涉正常细胞过程而被称作病原体。它们行动起来可能相对任意一些,例如通过抑制使它们复制的必要的酶或者通过干涉产生必须的RNA。它们代表了不正常的分子,尤其是在单个基因的表达上。
另一种不同的代表是痒病,它是造成山羊和绵羊营养缺失的原因。这种疾病和人类疾病中影响脑功能的病:库鲁病和伊茨费尔特一雅各布综合症有关。
这种痒病的感染性物质表面上不包括任何核苷酸。另一种代表叫蛋白病毒,它是一个28KD的硫水糖蛋白,PrP。PrP编码一个细胞的基因(在哺乳动物中),这个基因在正常大脑中表达,这个蛋白有两种存在形式。在正常脑中发现的叫PrPc ,它被蛋白酶所完全降解。另一种感染大脑的蛋白叫PrPsc,它不被蛋白酶所降解。我们认为一些修饰和构象的改变使得PrPc 和PrPsc得以转换。
这些象痒病和PrPsc为代表的感染性病毒必须通过修饰正常的细胞相应物来具有传染性,缺少PrP基因的小鼠并不得痒病,这就说明PrP是产生这种疾病所必须的。
我们怎样得到这种结论呢?去动物体外合成PrP,在试管中,在细菌中和在被培养的哺乳动物细胞中为分离做了充分的准备。我们需要在试管中由发现PrPc 与PrPsc的转换来得到它们性质的改变,而具有了传染性。
概 要
两个著名的实验证明了DNA是遗传物质。从肺炎球菌一个链中分离出来的DNA可以将其中的性质赋予另一个链上。而且DNA是子代噬菌体从母代继承的唯一成分。最近DNA又被用来向真核细胞转移新的特性。
DNA的双螺旋是由反平行的链构成的,其中核苷酸单位是由5’—3’的磷酸二脂键连接的。主链作为外型;嘌呤和嘧啶以A-T,G-C碱基配对形式堆积于内部。在半保留复制中双链解开并按照碱基配对原则组装成子链。碱基配对原则也适用于RNA转录双链DNA中一条链的过程。
DNA的线性用来编码蛋白质。遗传密码反映了DNA序列与蛋白质序列之间的关系。而双链DNA中只有一条链是编码蛋白质的。并且DNA的编码序列是由一系列有固定起始点的序列组成。一个密码子含有三个核苷酸,这三个核苷酸代表一个氨基酸。
一条染色体是由含有多个基因互不干扰的双链DNA构成。每一个基因(或顺反子)被转录成RNA,如果这个基因编码蛋白那随后这个RNA就翻译成相应的氨基酸序列。基因的RNA或DNA产物产生反式作用。基因可以通过互补检测来确定它在单链线性DNA上的位点。DNA上调节临近基因活性的位点产生顺式作用。
基因可以含有多等位基因。失去功能的等位基因产生隐性基因。无效等位基因就是失去功能的等位基因的总和。而用功能的等位基因产生显性基因。
突变是指DNA的A-T G-C碱基对序列的改变。编码序列的突变,可以引起与它相应蛋白的氨基酸序列的改变。移码突变是插入或删除一个碱基改变阅读框架顺序;在这个突变位点以后将产生一套全新的氨基酸序列。点突变的发生只改变发生突变的密码子产生的氨基酸。点突变可以通过回复突变复原,插入突变可以去掉突变而回复,但是删除突变是不能回复的。
突变的自然发生率可以由诱变剂提高。突变集中在突变热点。典型的突变热点被认为是在修饰过的5-甲基胞嘧啶处发生去氨基作用而产生的点突变。
正突变以每代每座位10-16的速率发生;回复突变几率更小。但并不是所有的突变都对表型产生影响。
虽然所有细胞中的遗传信息由DNA携带,而且病毒可以是双链或单链的RNA或DNA的基因组。但是无壳病毒是低生活力的类病毒,它们仅仅含有小的环形RNA分子,无蛋白质外壳。它们的RNA不是编码蛋白,而它们形成和发病的模式还不清楚。而元病毒则表现为只由蛋白质构成。
第一章 习题
概念题
什么叫做转化?
答:转化:细菌在基因重组作用中,受体细胞染色体内参入了一段提纯的DNA片断。
什么叫做转染?
答:转染(transfection) 在组织培养中,外来DNA导入真核细胞,DNA可以是病毒DNA或其他类型的DNA。
什么是碱基互补配对原则?
答:碱基互补配对原则,在一个双螺旋核酸结构中腺嘌呤必与胸腺嘧啶(或尿嘧啶)形成碱基对,而胞嘧啶必与鸟嘌呤形成碱基对,反之亦然,这一原则广泛适用于DNA-DNA,RNA-RNA和RNA-DNA
什么叫做半保留复制
答:半保留复制:双链DNA的一种复制方式,其亲代链分离,每一子代DNA分子由一条亲代链和一条新合成链组成。是DNA复制的常规模式,每条亲代链均作为合成新的互补链的模板。
什么叫做抑制?
答:抑制(校正):通过在染色体的不同部位上发生的第二次突变,可部分地或全部的恢复(第一次)突变所丧失的基因功能。
什么叫做突变热点?
答:基因上有些位置可以发生数个突变,有的则不发生。有些位点突变的次数远远高于随机碰撞的预期值,可以比随机碰撞的预期值高出十倍甚至一百倍。这些位点称为“突变热点”。
什么叫做等位基因间互补作用
答:在野生型细胞中,活性蛋白质有几个相同的亚基组成,但当一个细胞有两个变异的等位基因时它们的产物以两种不同的亚基聚成蛋白质。两种变异可能有补偿作用,即是单种变异的蛋白质是无活性的。两种变异组成的蛋白质可以是活性的。这种作用叫做等位基因间互补作用。
什么叫做零突变?
答:基因突变导致完全失去基因功能,往往是因为整个基因的缺失,叫零突变。如果这个基因很重要,那么零突变将是致命的。
什么是密码子,阅读框架,移码和抑制因素?
答:与DNA顺序及相应蛋白质顺序密切相关的叫遗传密码
遗传密码中,每三个核苷酸编码一个氨基酸,称为密码子。
如果遗传密码按不重叠的三联体方式解读,那么,把一个核苷酸序列翻译成蛋白质将会有决定于起始位点的三种不同解读方式,称为阅读框架。
插入或缺失一个碱基的突变将改变随后整个序列的阅读框架,这就是所谓的移码。
所有呀啶类试剂诱发的突变可分成两类,用(+)和(-)表示。每一类型的突变自身都导致移码,(+)增加一个碱基,(-)型则除去一个碱基。双突变结合(++)型和(--)仍显示为突变型。但(+-)型或(-+)型的结合则互相抑制,我们称其中一个为另一个的抑制因素。
怎么判断基因和蛋白是共线性的?
答:把一个基因的核苷酸序列和一个蛋白的氨基酸序列来做比较,我们可以直接得出是否这个基因和蛋白是共线性的:是否基因中的核苷酸序列恰好与蛋白质中的氨基酸序列相符合。
什么是编码区?
答:信使RNA包括一个核苷酸序列,它与蛋白质中的氨基酸序列相对应,这部分核酸叫做编码区。
什么是类病毒,特点是什么?
答:类病毒是在高等植物中造成疾病的传染性物质,它们是很小的RNA颗粒。不象病毒,它的传染性物质由病毒粒子组成,被蛋白所包蚀的基因,病毒RNA也是传染性物质,病毒粒子只由RNA组成,它的象典型标准的碱基,杆状结构的突变使它减少了感染性。
简答题:
1 简单描述在有胸腺嘧啶相似物溴脲嘧啶(BraU)混入DNA是怎么导致A.T被G.C取代?
答:溴脲嘧啶具有不确定的配对性质,这是因为溴原子使碱基发生酮式与烯醇式间的转换。烯醇式能与鸟嘌呤配对,形成B-G配对,代替了A-T配对。经过一次复制产生一条G-C配对,而G-C会稳定遗传下去,就使基因产生点突变。
2 已知某一RNA碱基序列为: AGGUAACCGUAGGGGAACCUGCGGUUGGACU ACCUCCUUA3’请依据碱基互补配对写出一种单链内配对的形式,发卡越少越好。
答:AGGUAACCGUAGGGGAACCUGCGGUU GGACU ACCU CCUUA3’
3 简述区分点突变、插入或缺失突变的方法
答:根据它们的回复性。点突变可以通过重建原序列或在基因的其它部位进行一次互补突变得以回复;插入可以通过缺失插入成分得以回复;缺失不可回复。
4 简单解释A和B等位基因在AO和BO杂合子中的显性
答:零突变O型血没有蛋白质功能,但有功能A型和B 型是等显性的。
O(或H)抗原在任何个体中都产生,由特定的碳水化合物基团与蛋白质结合而成。ABO位点携带密码,生成半乳糖基转移酶,O抗原再加一个糖基。这种酶的特异性决定了血型。A型等位基因产生辅助因子UDP—N—乙酰半乳糖,产生A抗原。B型UDP—半乳糖,产生B抗原。A和B的转化酶有四个氨基酸不同,所以辅助因子的作用也不同。O型有一个没有这种功能的变异(一个小的删除),未加工的O型抗原就产生了。
这就解释了A和B等位基因在AO和BO杂合子中的显性,与之相应的转化酶产生了A或B抗原。在AB型杂合子中A和B等位基因等显性。因为两种转化酶都起了作用。OO纯合子没有功能,所以没有以上两种抗体。
5 简述在大肠杆菌中含5-甲基胞嘧啶的位点G•C怎样转换为A•T对的。
答:含5-甲基胞嘧啶的位点已证实为自发突变的突变热点。每次突变,G•C就转换为A•T对。在大肠杆菌中,不发生甲基化的DNA链就没有突变热点。
突变热点的成因是5-甲基胞嘧啶经常发生脱氨基反应。羰基取代氨基使5-甲基胞嘧啶变成胸腺嘧啶。
胞嘧啶脱氨基生成脲嘧啶,而大肠杆菌含有一种脲嘧啶—DNA—糖苷酶,它能将脲嘧啶残基从DNA里除去。反应结果留下未配对的G残基,接着,“修复系统”便会将一个C碱基插入与之配对。反应的最终结果是原DNA的序列将得以保留。也许这套系统正是用来保护DNA以抵抗经常发生的自发的胞嘧啶脱氨基反应。(虽然它没有足够的活性以抵抗亚硝酸的作用)
但5-甲基胞嘧啶脱氨基留下来了。胸腺嘧啶这个碱基是DNA本身所具有的成分,系统无法识别这样的变化,最终发生了突变。这个转化生成一个误配的G•T对,在随后的复制中两者分离,产生一个野生型的G•C和突变型的A•T对。
6 “不重叠”和“特定起始位点”各意味着什么?
答:“不重叠”意味这每个密码子包含三个核苷酸,即一个完整的核苷酸三联体表达一个完整的密码子。
“特定起始位点”意味这蛋白质的合成必须由一端顺序进行到另一端,因此不同部分的编码序列不能分别解读。
7 在一个蝗虫的二倍体上,它的基因带有两个不同的突变,分别说明
答:如果在一个等位基因上所有的突变都是顺式,则另一个等位基因没有突变,是原生型的,但是如果突变是反式的,则每一个等位基因上有一个突变,两个等位基因都是突变体,其作用就在于突变决定了是否有一个功能性的等位基因。
8 什么是顺式型,什么是反式型,以及它们不不同?
答:一个调控点的缺失仅仅影响它所联系的密码区,并不影响其它等位基因的表达,一个仅仅影响邻近 DNA序列性质的突变叫顺式型。正常蛋白的缺失将阻碍所有的等位基因的表达,这种突变则叫做反式。
所不同的是,如果一个突变是反式的,则在一个细胞中作用于多靶细胞的可扩散产物(特别是蛋白)就将产生。但是,如果一个突变是顺式的,则一定是通过临近的DNA 来起作用,就是说它不以RNA或蛋白形式来表达。
问答题
复制,转录,翻译所扮演的角色。
答:从中心法则的观点看:
核酸包括了DNA或者RNA两种遗传材料。细胞只用DNA。一些病毒是用RNA,并且病毒RNA的复制发生在受感染的细胞中。
细胞遗传信息的表达一般是单向的。DNA转录产生RNA分子,这种分子只能被进一步运用来产生蛋白质序列,一般来说,他们不能回复来当作遗传信息重复使用。RNA翻译到蛋白一般是不可逆的。
;点突变与移码突变的区别,请举例说明。
答:密码的特性预见了两种不同形式的异变物会有不同的影响。如果一个特定的序列被另一个序列解读,比如:
UUU AAA GGG CCC (密码)
aa1 aa2 aa3 aa4 (氨基酸)
所以,一个突变点只能影响一个氨基酸。举个例子,A用其他的碱基(X)代替,引起了aa2被aa5取代:
UUU AAX GGG CCC
aa1 aa5 aa3 aa4
是因为只是改变了第二个密码。
但是突变要是插入或者删除一个单个的碱基将使它的阅读框架从突变开始所有的序列都发生改变。这种变化被称为移码。一个核苷酸的增加可能是以这种形式发生:
UUU AAX AGG GCC C
aa1 aa5 aa6 aa7
因为新的三联体顺序已经完全不同于旧的了,蛋白质的所有氨基酸顺序从突变点开始往后都将被改变。所以蛋白质的结构功能很可能全部的丢失。
问题(概念):怎么判断基因和蛋白是共线性的?
把一个基因的核苷酸序列和一个蛋白的氨基酸序列来做比较,我们可以直接得出是否这个基因和蛋白是共线性的:是否基因中的核苷酸序列恰好与蛋白质中的氨基酸序列相符合。
思考题
由于DNA双螺旋链的两条链是反向平行的,因此在复制叉附近解开的DNA链一条是5’--3’方向,另一条是3’--5’方向,两个模板极性不同。已知DNA聚合酶的合成方向都是5’--3’,都不是3’--5’,那怎么解释两条链同时复制呢?
答:具体参见DNA replication一章,主要是因为冈崎片断的存在。
现将第1章放上,因内容太多,打成文本将超过千页,将会陆续放上,当然,首先是大家都喜欢!
第1章 基因就是DNA
早在一个世纪以前,孟德尔(Mendel)定义了基因的基本属性。在他的两个定律中将基因归纳为一种“特殊因子”。在它从亲代传给子代的过程中是不改变的。同一个基因可能以不同的形式存在(突变)。
在二倍体的植物中,含有两个染色体组。每个子代从两个母代中各遗传到一组染色体。这同基因的行为相同。相当于发现染色体是基因的载体。
下一步是证明每条染色体是由线性排列的基因组成。孟德尔定律预测不同染色体上的基因将各自独立分开。然而在同一染色体上的基因表现为连锁遗传。基础观察显示不同染色体上的基因是以随机重组的方式代代相传,然而连锁性基因重组的几率下降,就是说它们有在一起不分离的趋势。
通过基因分析可以绘制出基因连锁图的结构,包含了1条染色体上携带的所有基因。连锁群的基因图与自然存在的染色体相一致。
在二十世纪前五十年建立高等生物的遗传图。基因被组合成像一个带子上的珠子。它们出现在固定的位置上,基因的重组包括同源染色体相同片断的迁移。基因是有各种可能的神秘物质(珠子),基因与它环绕物(带子)的联系是不清楚的。
高等真核生物重组图的建立因可相配的子代数目不多而受限制。两个接近的位点的发生重组的频率是很低的,仅仅可以观察在同一基因不同突变。可通过转移至产生大量后代的微生物系统中建立一个基因杂交体系,来示范发生在基因间的重组。这种方法同样符合以前推论的基因重组规律。
一个基因的突变可以呈直线排列,说明基因本身可以像在染色体上基因呈直线排列那样的直线结构。所以遗传图谱在基因之间是线性的:它由含有基因的完整序列组成。这个结论用现代的观点看就是,染色体的遗传物质是由代表很多基因的不间断的DNA组成。
基因组由任意特定生物体的一整套染色体组成,因此形成了一系列DNA分子,每个DNA分子包含一系列基因。因此最终确定基因组就是确定每条染色体的DNA序列。
图1.1总结了从过去对基因的构想到现在基因组的确定的不同阶段。在这一章,我们将分析基因组成中基本分子结构的根据。从已经证明的一个基因是由DNA组成及一条染色体是由表达不同基因的伸展性的DNA组成,我们转到复制和重组的自然基础,然后通过基因表达生成蛋白质。在第二章,我们着重处理更多的生物体的基因以及它的蛋白表达的细节。第三章里我们考虑基因的总体数量。在第四章,我们将讨论基因组的其它成分以及它结构的维持。
图1.1 遗传学的大事记
1865年 遗传因子是特殊的因子
1903年 染色体是遗传单位
1910年 基因位于染色体上
1913年 染色体上含有直线排列的基因
1927年 突变是基因的自然改变
1931年 交叉引起重组
1944年 DNA是遗传物质
1945年 一个遗传密码对应一个蛋白
1953年 DNA是双螺旋结构
1958年 DNA的半保留复制
1961年 遗传密码是三联体
1977年 DNA的测序
1997年 基因组测序
1998年
DNA是基本的遗传物质
在人们认识核酸的过程中,1928年发现的“转化”现象具有重要作用。老鼠被肺炎双球菌感染因患肺炎死亡。这种病菌的毒性来源于其表面的胶囊状多糖,因为表面的这种成分,它能使病菌免于被感染细胞分解。不同类型(I、II、III)的肺炎双球菌具有不同的胶囊多糖,但所有的有毒病菌的胶囊多糖的表面都是平滑型(S型)。
每个S型肺炎病菌都可能会发生某种变化而不能合成胶囊多糖,产生粗糙型(R型)表面病菌(由位于S型病毒胶囊多糖层下的物质组成),它们是无毒性的;在用R型病毒感染老鼠的实验中,由于被老鼠体内的抗体破坏而不会使老鼠致病。
对S型病菌进行热处理后,它们就不再具有毒性。但是一旦将这种热处理后的、无活性的病菌和R型病菌混合就会重新产生毒性。图1.2表明如果将两种无毒的病菌的混合物植入动物体内,就能使动物感染肺炎并死亡。而在病死的老鼠身上我们能检验到S型病菌的存在。
在这个实验所用的病菌中,无活性的S型病菌是III型的,有活性的R型病菌是从II型中提取的,而在死鼠身上检验到的有毒病菌的外壳与III型一样。这说明无活性的S型病菌的一部分物质促使有活性的R型病菌转化为S型病菌,因而能够合成胶囊多糖具有了毒性。
已死亡的病菌中的参与转化的那一部分物质称之为转化物。借助细胞分离机制、技术的发展,我们能够从无活性的S型病菌中提取出来的提取物在感染动物前加入到R型病菌中去。在1944年Avery和他的同事们的实验表明转移物的化学组成实际上就是脱氧核糖核酸(DNA)。
DNA的发现其意义是巨大深远的:虽然很久以前人们就认识到DNA是真核生物染色体的重要和通用的遗传物质组成部分, 但并不认为DNA也存在于肺炎球菌属的细菌中,同时也统一了人们在对细菌以及其它高级别生物体的遗传上的认识。
图1.2 DNA是转化的原理
对于实验的结果在原文中这样分析到:“从化学、物理性质上分析,诱导物可能就是一种具有高聚合性和粘性的DNA。从另一个方面来看,III性的毒性多糖主要含无氮多糖,其合成受诱导物激发......如此我们就可以证明诱导物及其依次的产物在化学性质和生理作用上是截然不同的,专一的,而且在决定它们所控制的细胞部分的类型上是不可缺少的。”
这一段分析介绍了遗传物质与其表达产物的区别,也为后来的研究奠定了重要的理论基础。
认识到转移物是DNA后,接下来一步我们需要去证实DNA能在完全不同的体系中提供遗传信息。病毒噬菌体T2能够感染大肠杆菌。当把噬菌体微粒加入大肠杆菌中后,它们吸附在大肠杆菌的表面,把其体内的部分物质注入到大肠杆菌内部,大约20分钟后大肠杆菌就会破裂,释放出大量的子代噬菌体的颗粒。
1952年,Hershey和Chase用放射性元素分别标定两组噬菌体:一组用32P标定其DNA,一组用35S标定蛋白质,然后分别感染大肠杆菌。图1.3就表示了这个试验的过程及结果。
将感染后的大肠杆菌搅拌均匀离心分离得到两部分:一部分含有从大肠杆菌表面剥落的噬菌体空壳,这一部分主要由被35S标定的蛋白质组成;另一部分则只有被感染的大肠杆菌。
检测结果表明,大部分放射性32P存在于被感染的大肠杆菌内。产生的子代噬菌体颗粒含约30%的32P。相反在子代噬菌体颗粒中含有很少的——不到1%的35S。这个试验直接表明母体噬菌体的DNA进入大肠杆菌体内并成为子代噬菌体的一部分,而这正反映了遗传物质进行遗传活动的模式。
图1.3 T2噬菌体的遗传物质是DNA
噬菌体(或病毒)能够利用宿主的组织复制自己。噬菌体的遗传物质与细胞基因组的性质相似:能够精确复制,服从相同的遗传规律。噬菌体T2的这种性质更有力的证明:无论是细胞还是病毒,其遗传物质都是DNA。
当DNA加入到某种在培养基中培养的真核单细胞生物群落中,核酸就会进入到细胞中去,其中有一部分就会合成出一些新的蛋白质。早些时候是用提取的DNA混合物试验,现在我们可以利用纯化的DNA使之与寄主细胞融合并产生特异的蛋白质。图1.4表示的就是一个标准实验。
图1.4真核细胞获得新的表型是加入DNA转染使的结果
虽然由于历史原因,人们把利用真核细胞做的试验称之为转染,认为与细菌的转化是相似的。DNA被导入受体细胞中后,便成为受体细胞的一部分,与其他部分按相同的方式遗传。导入DNA的表达将使细胞产生一些新的特性(图示中是胸腺嘧啶核苷激酶的合成)。初期这些试验仅仅在那些培养基中培养的单细胞中获得了成功。到目前,人类已经成功的通过显微注射技术将DNA导入老鼠的受精卵并使之成为鼠遗传物质的组成部分,稳定的遗传。(详细内容见第17章)
这些实验直接说明DNA不仅是真核生物的遗传物质,而且能够在不同物种间相互转移并保持功能活性。
DNA是目前所知的所有有机体以及许多病毒的遗传物质。当然,有一些病毒使用另一种核酸——核糖核酸(RNA)——作为遗传物质。其化学组成结构与DNA只是略有不同,在生命体中起着相同的作用。由此可见,遗传物质的本质就是核酸,实际上,除了病毒是RNA外都是DNA。
DNA的双螺旋结构
核酸分子是由多聚核苷酸链组成的。图1.5说明核酸键的骨架是由一系列可变的异戊糖(环形五碳糖)和磷酸酯基团组成的。一个嘌呤或嘧啶的含氮碱基与糖基相连。DNA是根据它的糖(2-脱氧核糖);RNA的命名是因为糖(核糖)。区别就是在RNA五碳糖2号位上含有OH基。
图1.5 多核糖键是由一系列5’—3’糖-磷酸键作为主链和含有碱基突出组成的
核酸分子有四种碱基:两种嘌呤——鸟嘌呤和腺嘌呤,在RNA和DNA中都存在。在DNA中两种嘧啶分别是胞嘧啶和胸腺嘧啶,在RNA中胸腺嘧啶被尿嘧啶替代。尿嘧啶与胸腺嘧啶结构很相似,只是在C5的位置上有一个甲基的区别。这些碱基常用它们开头字母来代表,在DNA中含A、G、C、T,而在RNA中则有A、G、C、U。
碱基利用嘧啶环上的N1、嘌呤环上N9与戊糖环1位上的碳原子形成糖苷键与戊糖相连。为了避免混淆杂环与糖环上的编号,戊糖环上C位常加(’)以区别。
其中一个戊糖的C5通过磷酸脂基与另一个戊糖上的C3相连(如图1.5所示),如此5’-3’磷酸双脂键便形成了糖基-磷酸脂基主链,而碱基则从主链“伸出去”。
在核苷酸链一末端有一个自由的5’基团,而另一端则存在一个自由的3’基团。为了方便认读,通常按5’—3’的顺序记录,即5’端在左,3’端在右。
观察表明不同物种DNA中各种碱基的含量不同,这就是人想到:碱基序列正是遗传信息的载体形式。到二十世纪五十年代,遗传信息的概念已经被人们广泛的认同,但同时也提出了两个新的课题:一个是DNA的结构;另一个是碱基序列是如何编码蛋白质的氨基酸序列的。
1953年,基于当时三个方面的发现,Watson和Crick提出了双螺旋模型。三个方面的发现是:
X光衍射实验数据表明DNA是一种规则螺旋结构:每3.4nm旋转一周,直径约为2nm。因为相邻核苷酸距离为0.34nm,因此每圈有10个核苷酸单位。
DNA密度测量说明这种螺旋结构应有两条链。而且如果两条链间的碱基都是朝里而且严格的按嘌呤对嘧啶排列,那么就可以阻止嘌呤对嘌呤(太粗),嘧啶对嘧啶(太细)的形成。
不论碱基数目多少,G的含量总是与C一样,而A与T 也是一样。因此通常以G+C的含量来描述DNA的组成。不同物种G+C的含量一般在26~74%。
图1.6 双螺旋键维护不变的宽度,因为嘌呤总与嘧啶遵循A-T,G-C
Watson和Crick认为DNA中两条核苷酸链是以碱基间的氢键相连的。G只与C特异性的以氢键相接,而A则只与T相作用。这种反应称之为碱基互补配对,而配对的碱基则被称之为互补(A与T,G与C)。
图1.7 平面配对的碱基位于垂直于糖—磷基主链
在这种模型中,两条核苷酸链是反向的(反平行),如图1.6描述的。沿着螺旋旋转方向,一条是5’-3’方向,而另一条是3’-5’方向。
糖基-磷酸脂基构成的主链暴露在外表面,并带有磷酸脂基的负电荷。当DNA处于体外溶液时,电荷被一些能与之结合的金属离子,一般是Na+,所中和;而在活体内,则是由带正电荷的蛋白质提供中和电荷。这些蛋白质在决定DNA的内型上起着很重要的作用。
碱基处于双螺旋结构的内部,它们是平面结构,垂直于螺旋轴成对排列。双螺旋体类似于盘旋的楼梯:碱基对如同踏板,就如图1.7所示。顺着螺旋,碱基一个堆一个,像一叠盘子。
图 1.8 DNA的双链构成双螺旋
每个碱基相对于其相邻的碱基对都绕螺旋轴旋转约36度。这样约10个碱基对就能旋转一周。双螺旋体中的两条链彼此环绕形成一条窄沟(约12nm宽)和一条宽沟(约22nm宽),这两条沟在电镜下形状见图1.8。双链是沿右手方向的;即顺时针方向转动。所有这些都是B-DNA所具有的特征。
DNA的复制是半保留的
遗传信息的一个重要特征就是能精确复制。因为DNA的两条链是由氢键连接因此开链时不存在共价键的断裂。由于碱基对的专一性结合,DNA的分开的两条链都能作为母链为互补的子链的合成的模板,复制过程见图1.9。就有一条母链连接一条新链,其中新链的序列是由母链决定:母链中的A将使子链中相应位置为T,而母链中的G将对应子链中的C等等。
图上部的是母双体,下半部分是利用碱基互补作用产生的两个子双体,母双体(非复制物)中含两条母链。复制就需要两条母链打开分别作为子链合成的模板。子双体含有一条母链和一条新链,其序列与母双体完全相同。如此DNA的结构使得它的序列能稳定的遗传。
图1.9 碱基配对提供了DNA复制的机制
图1.10是从整体上反映一个DNA分子的复制过程。母双体复制形成两个子双体,每个子双体又含一条母链和一条新合成的子链。那么可见母双体中的一条母链就完全的转入了子双体中,这种现象称之为半保留复制。
图中所表示的就是对这种半保留复制的研究实验。如果把有机体放入到一个含合适的放射性元素(如15N)的介质中培养,则在母双体DNA中就含有“重”原子,而该有机物在正常介质中的复制物只含有“轻”原子同位素。
母体DNA中有两条含重原子的链(红色表示),在轻原子介质中培养一代后,子代的DNA是一种“杂合体”——包括一条含重原子的母链(红色)和一条含轻原子的子链(蓝色)。在二代中,杂合双体的两条链重又分开,各与一条含轻原子的互补链结合,这样有一半是杂合双体,另一半只含含有轻原子链的双链(都是蓝链)。
图1.10 DNA的复制是半保留的
不管是杂合双体还是纯合双体,其中任何一条链要么是含重原子的要么是含轻原子的。1958年的Meselson-Stahl实验证实了这一观点,在这个实验中观察了三代酵母菌的DNA复制。从细胞中提取出DNA,离心测量其密度,则DNA按密度分成三带:最重的是母体,杂合体是第一代,第二代中一半是杂合体一半是纯合双体。
DNA复制过程中很重要的一步是开链。虽然两条母链必须打开,但它们从不以单链形式存在。双链结构的打开是很短暂的,很快它们就与形成的子链重又环绕成双链结构。因此在任意时刻只有一小部分DNA失去双链结构。
图1.11显示了DNA分子复制的杂和结构。非复制区是母双体,而打开的双链部分是子双体的复制区。母双体在两个复制区间的位置打开,该区域被称之为复制叉。在整个复制过程中,复制叉沿着母双体不断运动。整个复制过程实际上就是持续的母双体解旋与子双体复旋。
图1.11 复制叉是含从解旋的母双链转变新复
制的子双链的DNA区域
核酸是在特定的酶的催化下合成的,这些酶能够识别催化模板,并催化亚基加到正在合成的多核苷酸链上。这些酶根据它们所催化合成的核酸链来命名:DNA合成酶和RNA合成酶。
核酸的降解也是在特定的酶催化下进行的:脱氧核糖核酸酶(DNAase)降解DNA,核糖核酸酶(RNAase)降解RNA。核酸酶通常可分为核酸外切酶和核酸内切酶。核酸内切酶能切割DNA或RNA内的特定的核苷键,产生分离的核酸片段。这属于切割反应。核酸外切酶每次从分子末端移走一个残基,产生单核苷酸,这属于修整反应。
核酸碱基配对杂交
双链解旋的一个重要性质就是在不破坏共价建的情况下解旋。使得在生理条件下高速的条件下解旋和复旋而保持遗传功能成为可能。
图1.12 碱基配对发生在DNA双螺旋链也存
在于单链RNA(或DNA)分子内或分子间的反应
在核酸中,碱基互补配对原则是各种过程的核心。碱基对的分裂是双链分子的一个功能,同时形成碱基对的的能力也是单链核酸活性中不可缺的。图1.12描述了维持双螺旋的分子间碱基配对或复制聚合成二倍体或单链核酸分子自我互补形成双键结构都是相同的碱基互补机制。单链分子上互补的序列按照碱基互补形成分子间的双链结构一个单链核酸与另一个独立的单链核酸的互补单链的碱基互补并不严格局限于DNA—DNA或RNA—RNA,同时在DNA和 RNA分子间也可以发生。
互补链间不存在共价键,使体外操纵DNA成为可能。维持双键的非共价力,可以用加热或暴露于低盐溶液中破坏。当它们之间的氢键全部打开后双螺旋的两条链也完全分开。
链解开的过程称为变性或(俗称)熔解。(变性也用来描述蛋白质真实结构的失去;变性一般是高分子自然结构改变成另一种形式。)
图1.13 变性的DNA单链可复性为双螺旋
DNA的变性发生在一个很窄的温度范围,而且由它不同物理性质有很明显的改变。DNA分离变性的温度范围的中点温度称为熔解温度(Tm).它是由G•C碱基对的比例决定的。因为每个G•C碱基间有三个氢键,比只有两个氢键的A•T碱基对稳定。DNA中G•C碱基对越多,使它解旋需要的能量就越多。在近似生理条件下,含有40%G•C 的DNA——哺乳动物基因组的典型比例——的变性熔解温度大约为87°C。因此,排除细胞组织系统的干扰,在细胞温度下双链DNA占优势。
核酸序列可以用相似性和互补性来衡量.
• 两个核酸序列之间的相似性是指相同碱基(单链序列)或碱基对(双链序列)的比例。比如基因间的比较可以用这种方法,但要求先直接确定基因的真实碱基序列。
• 互补性由A•T和G•C碱基配对规则所决定.在完全配对的双螺旋结构中,双链精确互补.如果我们相互比较两个不同但相关的双链分子,第一个分子的每一单链同另一分子对应单链相同,与另一单链(部分)互补。互补性可以直接通过两个单链核酸相互碱基配对能力来衡量。如双链分子变性成为单链,单链的互补性表示原双螺旋结构的互补性。
测量互补性可行是因为变性在合适条件下是可逆过程.两条解离的互补单链恢复成为原双螺旋结构的过程称为复性。图1.13描述了这一过程。
复性依赖互补链之间的特定碱基配对。反应分两个阶段。第一阶段DNA单链分子随机与另一个单链分子在溶液中相遇;如果序列互补,两个单链配对形成短的双螺旋区。然后碱基配对区沿分子扩展,在拉链式作用的作用下,形成长双螺旋分子。复性时可以恢复变性中丧失的原有性质。
图1.14 过滤器杂交来确定含变性DNA(或RNA)的中溶液中的单链是否含有与固定在过滤器中的单链互补
复性指两条在变性过程中分开的互补链之间的反应。但这种技术可以扩展,允许任何两条互补的核酸序列互相淬火形成双螺旋结构。涉及来源不同的核酸序列的过程通常被称为杂交,如一条来自DNA,一条来自RNA的情况。两个核酸序列相互杂交的能力提供了一个精确测量互补性的方法,因为只有互补碱基序列才能形成双螺旋结构。
杂交反应的方法是将两个单链核酸制品合在一起,并测量形成的双螺旋结构的数目。
图1.14描述了如下过程:DNA变性时单链被吸附至滤膜, 然后添加另一失活的DNA(或RNA), 新添单链仅当它能与被吸附的DNA碱基配对时才被吸收。通常程序是添加一带有放射性标记的DNA或RNA分子到滤膜,由被滤膜固定的放射性标记量来衡量反应程度。
两单链核酸之间的杂交程度由它们之间的互补程度决定。两个序列不需要完全互补杂交,如果非常接近但非完全相同,可以在不互补的片段处, 碱基不配对,形成不完全的双螺旋结构。
突变改变DNA顺序
突变为 DNA是遗传物质的观点提供了决定性是证据。DNA序列的改变导致蛋白质序列的改变,由此可以得出DNA编码蛋白质的结论。更进一步,根据有机体的表现型的改变,我们可以判定蛋白质的作用。基因中不同突变的存在使得可以对多种形式的蛋白质进行比较,通过更详细的分析,可以判定蛋白质作为酶或其它功能的范围。
正常细胞过程或与环境随机接触使所有生物发生一定数量的突变,称为自发突变。不同物种自发突变的发生有一定的特征几率,称为背景水平。突变属于小概率事件,并且在进化过程中,有害突变遭到选择淘汰。因此,从自然种群获得大量自发突变以供研究是很困难的。
用适当的化合物,可以增加突变的发生。这样的化合物称为诱导剂,这样的突变称为诱导突变。大多数突变试剂通过修饰特定碱基或并入核酸而直接反应。一个诱导剂的效率是由在背景水平上突变速率的增加的程度来判断的。用突变试剂可以改变任何一个基因。
DNA任何一个碱基对都会发生突变。一个点突变只改变一个碱基对,它可以发生在如下两种情况:
对DNA直接改变一个碱基的化学修饰。
DNA复制过程中的功能失常导致错误碱基在DNA合成时插入多核苷酸链。
根据一个碱基取代另一个碱基时变化的性质,可以把点突变分成两类:
最常见的一类是转换,包括一个嘧啶被另一个嘧啶替代,或一个嘌呤被另一个嘌呤替代;这样一个G•C对被换成A•T对。反之亦然。
图1.15 突变可以是用化学诱导法改变一个碱基得到
比较少的一类是颠换,在此过程中,一个嘌呤为一个嘧啶所取代,反之亦然,即一个A•T对变成一个T•A或C•G对。
在亚硝酸的作用下,一个碱基发生化学反应转化成另一个碱基,是转换的典型例子。如图1.15所示,亚硝酸作为氧化脱氨基试剂将胞嘧啶转化为脲嘧啶。在转换以后的复制循环中,将会有一个A与U配对,代替G与原来的C配对。这样,在下一次复制循环中,A与T配对使原来的C•G对为T•A所取代。亚硝基还能使腺嘌呤脱氨基,使A•T对逆转为G•C对。
当异常的碱基对违背通常的Watson-Crick配对原则时,碱基转换也由碱基误配产生。碱基误配通常由异常碱基的引入所引起。
图1.16 突变可以从向DNA引入碱基的相似物产生
一些诱导剂是正常碱基的类似物,具有含糊的配对性质。它们混入DNA并取代一个正常的碱基,导致突变反应。如图1.16所示,胸腺嘧啶的甲基被溴原子取代,就成了其相似物溴脲嘧啶(BraU)。溴脲嘧啶混入DNA,取代胸腺嘧啶。但它具有不确定的配对性质,这是因为溴原子使碱基发生酮式与烯醇式间的转换。烯醇式能与鸟嘌呤配对,导致A•T对被G•C对所取代。
碱基在最初的混合或其后的复制循环中都会发生误配。在每次复制循环中都有几种可能诱发碱基转换,因此,溴代脲嘧啶的混入对DNA序列具有持续影响。
碱基取代诱发的突变通常有漏洞:突变型还残留一定的功能。这种情况发生在DNA序列改变而相应的蛋白质活性不会完全消失的时候。
长期以来,点突变被认为是单个基因改变的基本方式。然而现在我们知道,用额外成分插入一段基因也是经常的。插入成分来源于转座因子,即可以从一个位置移到另一个位置的DNA序列。(我们将在15章和16章讨论这种成分。)插入通常使基因的活性完全丧失。在插入处,部分或全部插入材料以及一些临近片段的缺失随后发生。
点突变和插入/缺失的一个重要区别是,突变剂可以提高点突变的频率,却对“可移成分”导致的突变毫无作用。而且,插入和缺失可通过其它机制发生——例如,复制或重组过程中的错误或基因交换——虽然它们可能更少见。由称为丫啶类的一类的诱导剂引入插入和缺失(很少的一部分)。
不同的回复性是区别点突变、插入与缺失的重要特征:
点突变可以通过重建原序列或在基因的其它部位进行一次互补突变得以回复。
插入可以通过缺失插入成分得以回复。
缺失不可回复。
其它基因也可能发生突变以阻遏原基因突变的影响。这种作用称为抑制,或更常用的相互顺反抑制。一个突变转座子阻遏另一个转座子的突变作用叫做抑制基因。
突变集中在突变热点上
上面我们讨论了单独改变DNA序列对基因单位活性的影响。在我们以突变对基因的活性影响的观点来考虑时,一个物种的基因或多或少表现为大小相似,其突变几率也相似。这表明基因可以看作是突变的靶子,并且任何碱基对的改变,都会破坏基因的功能。这样一来,基因对突变的感受性就近似与其大小成比例。但如果考虑DNA序列里突变发生的位置的话,到底是所有的碱基对都具有相同的感受性呢,还是某些部位比其它部位更易于发生突变呢?
当我们分离同一基因上大量独立的突变时会怎样呢?首先要获得大量发生单一突变的变种,这样每一种突变的位置就可以确定。多数突变发生在不同的位置上,但有些则发生在同一位置。发生在同一位置上的两个独立隔绝的突变,在DNA上可能恰好有一样的变化(这种情况是因为同一突变发生在不同的条件下),或者可能导致DNA发生不同的变化(同一碱基对可以有三种不同的点突变)。
图1.17 自发突变遍及于大肠杆菌的lacl基因,但是集中在突变热点上。
图1.17的图形表示大肠杆菌乳糖酶Ⅱ基因各碱基对的突变频率。随机碰撞动力学给出了一个特定位点发生多个突变的统计概率(见图示位置分布)。即有些位置可以发生数个突变,有的则不发生。但事实上有些位点突变的次数远远高于随机碰撞的预期值,可以比随机碰撞的预期值高出十倍甚至一百倍。这些位点称为“突变热点”。自发突变可能发生在突变热点,不同突变剂也有其各自的突变热点。
大肠杆菌的自发突变的一个主要原因是DNA中一个异常碱基的出现。DNA复制时,除四个常见碱基插进DNA之外,有时会有“修饰碱基”混入。顾名思义,这些碱基是由DNA中四个常见碱基之一经化学修饰得到的。最常见的修饰碱基是5-甲基胞嘧啶,由甲基化酶将一个甲基加到一小部分胞嘧啶上(DNA的一些特定位点)而产生。
含5-甲基胞嘧啶的位点已证实为自发突变的突变热点。每次突变,G•C对就转换为A•T对。在大肠杆菌中,不发生甲基化的DNA链就没有突变热点。
突变热点的成因是5-甲基胞嘧啶经常发生脱氨基反应。羰基取代氨基使5-甲基胞嘧啶变成胸腺嘧啶,图1.18分析了为什么(稀有的)5-甲基胞嘧啶脱氨基会诱发突变,而更常见的胞嘧啶脱氨基却不会。
胞嘧啶脱氨基生成脲嘧啶,而大肠杆菌含有一种脲嘧啶—DNA—糖苷酶,它能将脲嘧啶残基从DNA里除去。反应结果留下未配对的G残基,接着,“修复系统”便会将一个C碱基插入与之配对。反应的最终结果是原DNA的序列将得以保留。也许这套系统正是用来保护DNA以抵抗经常发生的自发的胞嘧啶脱氨基反应。(虽然它没有足够的活性以抵抗亚硝酸的作用,见图1.15)
但5-甲基胞嘧啶脱氨基留下来了。胸腺嘧啶这个碱基是DNA本身所具有的成分,系统无法识别这样的变化,最终发生了突变。这个转化生成一个误配的G•T对,在随后的复制中两者分离,产生一个野生型的G•C对和突变型的A•T对。
图1.18 5-甲基包嘧啶脱氨基生成胸腺嘧啶
(使得G•C对转换成A•T对)。然而,包
嘧啶脱氨基却生成尿嘧啶(尿嘧啶通常被去除,
然后被包嘧啶取代)。
这套系统的操作过程对比较DNA中用T碱基而RNA中用U有所启发。或许它与DNA对序列稳定性的要求有关:T的使用意味着C脱氨基可以立即被识别出来,因为它们产生U碱基在DNA里不常见。
使基因失活的自发突变按每个座位每代~10-5—10-6的速率进行。这种突变速率对应的单个核苷酸变化速率为10-9—10-12次/代。我们还没有精确测定真核生物突变的速率,虽然通常认为它与每个座位对应一个基因的细菌相似。点突变占自发突变的多大比例也属未知数。
并不是每个DNA突变都会导致表现型发生可以检测到的变化。不表现作用的突变称为“静突变”,它可以分为两类。一类是DNA碱基的变化不改变其所编码蛋白质的氨基酸序列;另一类改变了蛋白质的氨基酸,但氨基酸的变化并不影响蛋白质的活性,这种情况称为“中性取代”。
使基因失活的突变称为“前进突变”,其逆效应为“后退突变”,它有两种类型。
一个突变精确的逆转为原基因,称为“真反转”。这样,如果一个A•T对为G•C对所取代,使之回复为A•T对的另一个突变就能精确的再生一个野生型。
另一种类型是发生在基因其它部位的第二个突变,恰好抵消了第一个突变的作用,称为“二次反转”。例如蛋白质一个氨基酸变化使其失去遗传功能,但第二个氨基酸变化恰好抵消了第一个变化的作用,使蛋白质复活。
前进突变是任何一个是基因失活的改变,而倒退突变则要恢复被特定前进突变破坏的蛋白质的功能。因此,要求倒退突变具有高的多的特异性。倒退突变的速率也相应要低得多,通常相差10倍左右。
顺反子是单条的DNA链
第一次系统的尝试使基因和酶联系起来表明了:新陈代谢路径的每一个阶段都被单一的一种酶催化,也可以被不同基因里的突变阻断。这导致了“一个基因一个酶”的学说。它认为每一个代谢反应均由一种酶催化,而这种酶是由一个特定基因产生的。一个基因的变异就改变了它所负责的蛋白质活动。
鉴定哪个蛋白质代表哪个基因是一个漫长的工作。产生孟德尔的皱豌豆的变异的原因直到1990年才被发现是由一种淀粉分支酶的基因的不表达引起的。
对整个基因结构来说,变异是随机发生的,最大的可能性是对基因功能的损坏甚至摧毁。这就解释了隐性变异的本质:它们代表了功能的缺失,因为变异基因的酶的产生被阻止了。图1.19显示了野生型等位基因对隐性等位基因的显性优势。当一个杂合子有一个野生型的等位基因和变异的等位基因时,野生型等位基因控制了酶的产生,从而是显性。(这是假设单个野生型等位基因产生了足够的酶,当单一的酶不足时,两种基因产生的不等量的酶产生了杂合子中的部分显性的表现型。)
图1.19 蛋白质的基因位点;显性可以用突变的蛋白质的肽键解释。一个隐性的等位基因队表现型没有贡献,因为它不产生蛋白质(或产生没有功能的蛋白质)。
这种学说在解释由亚基组成的蛋白质时需要修正。当亚基相同时,蛋白质叫同多聚体,由一个基因代表;当亚基不同时,蛋白质叫异多聚体。要作为一个更全面适用于所有异多聚体蛋白质的理论,一个基因一个蛋白质的学说可以更精确的表示为一个基因一个多肽链。
我们怎样确定位于同一个基因中的两个突变是否产生了相似的表现型。如果他们在基因图中相距很近时,它们可以组成等位基因。然而,它们也可能是不同基因中的,只是它们产生的蛋白质具有同样的功能。互补实验就是用来测定它们是否在同一基因内的。实验要得到两种变异的杂合子(通过交配两种变异体的纯和亲代。)
如果变异在同一基因中,亲代的基因型表示为M1/M1和M2/M2,一个亲代提供M1等位基因,另一个提供M2等位基因,杂合子的基因型为M1/M2。没有野生基因型,所以杂合子具有变异的表现型。如果变异体在不同基因处,亲代的基因型为M1+/M1+和+M2/+M2,每条染色体都有一个基因的野生型拷贝和另一个基因的变异型拷贝,杂合子的基因型则为M1+/+M2。亲代各提供了一个基因的野生型拷贝。杂合子的表现型为野生型,两个基因称为具有互补作用。
图1.20 互补实验可以定义顺反子。图中,基因用条块标注,红色的星标注了基因突变的点。
图1.20提供了互补实验的更精细的描述,实验的基本组成如图的上部分所示。如果两个突变在同一个基因里,我们将看到反势和顺势有不同的表现型。反势是变异体,因为每个等位基因都有一个(不同的)突变体。但是顺势是野生型,因为一个等位基因有两个突变体,但是另一个没有变异。然而,如果两个突变位于不同的基因里,我们总是能看见野生型的表现型。每一个基因里总有一个野生型和一个变异型,和构型是没有关系的。
当两个反式的变异不能互补时,我们推论得两者影响同一个功能,所以它们被归入同一互补组。我们认为一个互补组就是一种分立的基因单位,这种单位的学名叫顺反子。一个顺反子实际上就等于一个基因。基本地,这三个名次都是在描述DNA的一条链,它的功能是作为RNA和蛋白质起源的单位。
只有不同基因能互补的规则也有例外,就是当该基因产生的多肽链是同多聚体的亚基时。在野生型细胞中,活性蛋白质有几个相同的亚基组成,但当一个细胞有两个变异的等位基因时它们的产物以两种不同的亚基聚成蛋白质。两种变异可能有补偿作用,即是单种变异的蛋白质是无活性的。两种变异组成的蛋白质可以是活性的。这种作用叫做等位基因间互补作用。
复等位基因的本质
当一个基因被确定时,理论上就利用产生完全缺失这个基因的生物来决定它的功能。基因突变导致完全失去基因功能,往往是因为整个基因的缺失,叫零突变。如果这个基因很重要,那么零突变将是致命的。
要决定一个基因对于表现型是否或者有什么样的效果,就要对零突变进行研究。当一个突变不能影响表现型时,很可能是有漏隙——有足够的产物来维持功能,即使它的量小于或不等于野生型。但是如果一个零突变不影响表现型,我们可以下结论说这个基因不是必需的。
零突变和其他阻碍功能的突变(不一定要杀死生物)都叫做功能缺失型突变,它是隐性的。如图1.19所示。有时突变有反向作用,使蛋白质具有了新的功能,这种突变叫功能获得型突变,它是显性的。
如果基因里每个阻止活性蛋白生成的变化都产生一个隐性突变,那么在任何一个基因里都会有大量的突变。许多氨基酸的替换可能改变蛋白质的结构,足以阻碍其功能。相同基因里的不同变异叫复等位基因,它们的存在使得在突变的等位基因间组成杂合子成为可能。
这些复等位基因之间的关系有多种情况。
最简单的情况下,野生型基因带有有功能的蛋白质的密码,变异型基因带有无功能的蛋白质的密码。
但变异型的等位基因常有不同的表现型。如黑腹果蝇的白色位点的野生型是正常红眼发展必须的。当基因完全缺失时,使变异的纯合子长出白眼,位点也由此得名。
需要描述野生型或变异型等位基因时,野生型的基因型在位点的名字后加加号(W+是黑腹果蝇红眼的野生型等位基因),有时仅用+表示野生型等位基因。用位点的名字表示变异的等位基因。
完全缺失的基因(或没有表现型)用减号表示。对于不同的变异等位基因产生的不同效果,可用其它的标志,如Wi和Wa。
图1.21 w位点有很多的等位基因的系列。它们的表现型从野生的颜色(红)一直延伸到完全没有色素。
W+的等位基因在杂合子的基因中占显性地位。有很多种变异的等位基因。表1.21显示了一个小例子。虽然有些等位基因没有眼的颜色,许多等位基因产生相同颜色的眼睛。每种变异的等位基因都是基因中的不同变化。它没有完全消灭基因的作用,却有一种积累效应从而产生不同的表现型。这些等位基因是以它们纯合子的眼睛颜色定义的。(大多数等位基因影响眼睛色素的数量。这个范例中以颜色递减的顺序排列变异,但有些变异,如Wsp,是影响色素沉淀的方式)
当复等位基因存在时,一个个体也许是两种等位基因的杂合子。这个杂合子的表现型取决于每个等位基因对沉淀作用的影响。两个变异等位基因之间的关系与变异等位基因和野生型等位基因的关系一样,一个等位基因也许是显性,也许有部分显性,也许有等显性。
并不需要在任何位点都有一个野生型的等位基因。人类血液系统提供了一个范例:零突变O型血没有蛋白质功能,但有功能A型和B 型是等显性的。在图1.22中表示了这种关系。
图1.22 ABO位点携带密码,生成半乳糖基转
移酶。半乳糖基转移酶的特异性决定了血型。
O(或H)抗原在任何个体中都产生,由特定的碳水化合物基团与蛋白质结合而成。ABO位点携带密码,生成半乳糖基转移酶,O抗原再加一个糖基。这种酶的特异性决定了血型。A型等位基因产生辅助因子UDP—N—乙酰半乳糖,产生A抗原。B型UDP—半乳糖,产生B抗原。A和B的转化酶有四个氨基酸不同,所以辅助因子的作用也不同。O型有一个没有这种功能的变异(一个小的删除),未加工的O型抗原就产生了。
这就解释了A和B等位基因在AO和BO杂合子中的显性,与之相应的转化酶产生了A或B抗原。在AB型杂合子中A和B等位基因等显性。因为两种转化酶都起了作用。OO纯合子没有功能,所以没有以上两种抗体。
A或B都不能被认为是野生型。因为它们代表可互换的作用,而不是功能的获得或缺失。在一个种群中有多种有功能的等位基因时,被称为多态性。(参见第三章)
遗传密码-三联体
每个基因代表一个特定的多肽链。在1950年,Sanger 通过研究胰岛素的特性提出了一个蛋白质由特定的连续的氨基酸组成。基因由DNA组成这个发现呈现给世人,同时引起了对DNA的中核苷酸的顺序怎样代表蛋白质中氨基酸的顺序而进行讨论。
一般DNA的结构中最重要的特点是核苷酸是由有独立的特定的顺序的成分组成的。DNA中核苷酸的顺序之所以那么重要不是因为每个的结构,而是因为它指定了氨基酸顺序的遗传密码来构成相应的多肽。与DNA顺序及相应蛋白质顺序密切相关的叫遗传密码。
每一个蛋白质的结构和酶活性都是由它最主要的氨基酸序列决定的。由于决定蛋白质中氨基酸的顺序,基因能够携带所有的信息就需要指定的活性多肽链。这样一来,一个单一的结构-基因-就能用无数种多肽形式来表现自己。
总体来说,一个细胞的不同蛋白质产物承担了催化作用和结构活动,来完成它们建造自己表型的责任。当然,除了翻译蛋白质的基因序列,DNA也含有确定的序列,序列的功能就是能被调节分子识别,这种分子一般是蛋白质。在这里,DNA的序列直接的决定了它的功能,并没有通过中介的密码。两种不同形式的片断,基因表达就如同蛋白质和序列的识别,组成了遗传信息。
遗传密码通过复杂的机制由核酸翻译成蛋白质,只要DNA所携带的信息有意义,这样的机制就必然存在。在任何以知基因片段中,DNA双链只有一条用来编码蛋白质,因此,人们通过碱基序列(甚至不是碱基对)来记遗传密码。
遗传密码中,每三个核苷酸编码一个氨基酸,称为密码子。一个基因包含许多密码子,这些密码子从一端的起始点到另一端的终点按顺序排列。按传统的3’-5’方向书写的核苷酸顺序,对应蛋白质从N末端到C末端书写的氨基酸顺序。
基因是从特定起始位点开始,按不重叠的三联体方式读码的:
不重叠意味这每个密码子包含三个核苷酸,即一个完整的核苷酸三联体表达一个完整的密码子。
特定起始位点意味这蛋白质的合成必须由一端顺序进行到另一端,因此不同部分的编码序列不能分别解读。
密码的特性预见了两种不同形式的异变物会有不同的影响。如果一个特定的序列被另一个序列解读,比如:
UUU AAA GGG CCC (密码)
aa1 aa2 aa3 aa4 (氨基酸)
所以,一个突变点只能影响一个氨基酸。举个例子,A用其他的碱基(X)代替,引起了aa2被aa5取代:
UUU AAX GGG CCC
aa1 aa5 aa3 aa4
是因为只是改变了第二个密码。
但是突变要是插入或者删除一个单个的碱基将使它的阅读框架从突变开始所有的序列都发生改变。这种变化被称为移码。一个核苷酸的增加可能是以这种形式发生:
UUU AAX AGG GCC C
aa1 aa5 aa6 aa7
因为新的三联体顺序已经完全不同于旧的了,蛋白质的所有氨基酸顺序从突变点开始往后都将被改变。所以蛋白质的结构功能很可能全部的丢失。
移码突变由呀啶类试剂所引起,它与DNA结合,扭曲双螺旋结构,导致复制时核苷酸插入或缺少,从而诱导移码突变。呀啶类试剂导致的每一次基因突变,结果都是插入或者缺少一个碱基对。
如果一个呀啶突变体的产生是由核苷酸的增加,那它可以通过删除核苷酸来恢复到野生型。但这个逆反应也可能是临近碱基对的缺失。这两种突变的结合,提供了有关遗传密码本质的证据。
图1.25结构变异展示了遗传密码在三联体中从一个固定
的起始点被阅读。
图1.25描述了移码突变的特征。插入或缺失一个碱基改变了蛋白质突变位点后的整个序列。但如果一个插入和一个缺失同时发生,则只有两个突变位点之间的密码阅读框架出错;第二个突变位点后又恢复正确读码。
最初的分析用基因方进行。所有呀啶类试剂诱发的突变可分成两类,用(+)和(-)表示。每一类型的突变自身都导致移码,(+)增加一个碱基,(-)型则除去一个碱基。双突变结合(++)型和(--)仍显示为突变型。但(+-)型或(-+)型的结合则互相抑制,我们称其中一个为另一个的抑制因素(本文中“抑制因素”用的不是本意,见下文)。这个结果表明遗传密码是由特定起始位点开始按一定阅读框架解读的,因此插入和缺失可以互相抵消,而双插入或双缺失仍保持变异。但这仍未说明多少个核苷酸组成一个密码子。
当发生三突变时,仅有(+++)型和(---)型显示为野生型,而其他的组合则显示为变异。如果增加或者减少三个碱基恰好增加或减少一个氨基酸,这意味着遗传密码是按三联体解读的。在两个外侧突变点之间发生了氨基酸错序,而两侧的氨基酸顺序仍为野生型,如图1.25。
如果遗传密码按不重叠的三联体方式解读,那么,把一个核苷酸序列翻译成蛋白质将会有决定于起始位点的三种不同解读方式,称为阅读框架。对核苷酸序列:
A C G A C G A C G A C G A C G A C G
三个可能的阅读框架为:
ACG ACG ACG ACG ACG ACG
CGA CGA CGA CGA CGA CGA
GAC GAC GAC GAC GAC GAC
一个阅读框架组成了特定的三联体所代表的氨基酸叫一个畅通的阅读框架或者ORF。一个转入蛋白质的序列要有一个阅读框架,由一个起始密码(AUG)开始并沿着一套连续的代表氨基酸的三联体直接由三个终止密码(见第五章)中的一种来结束。
一个阅读框架不能被解读成蛋白质是一般是因为终止密码的阻断。如果一个序列被三种阅读框架阻断,它就没有翻译蛋白的功能了。
图1.26一个通畅的阅读框架由AUG开始并在三联体中继续直到遇到一个终止密码。阻断的阅读框架可能时常的被终止密码阻断。
当一个DNA区域的序列获得了一个新的功能结构,每一个阅读框架被分析后决定是否通畅还是阻断。一般在一个单个易伸缩得DNA中仅仅是三种阅读框架中的一种被开通。图1.26展现了一个例子,一种序列只能被一种阅读框架解读,如果阅读框架做二选一的运动就通常被终止密码阻断。一个长的通常的阅读框架不是偶然存在的,如果它不能被翻译成蛋白质,将有选择的阻止终止密码的堆积,所以长的通畅的阅读框架被识别首先的证据就是在框架中序列被翻译成蛋白质。一个通畅的阅读框架(ORF)不能确定任何蛋白产物,这种框架一般叫做不确定阅读框架(URF)。
原核生物的基因和蛋白是共线性的
把一个基因的核苷酸序列和一个蛋白的氨基酸序列来做比较,我们可以直接得出是否这个基因和蛋白是共线性的:是否基因中的核苷酸序列恰好与蛋白质中的氨基酸序列相符合。在细菌和它们的病毒中,有一个确切的等价物。每个基因包含一个连续的直链 DNA ,它的长度直接与它所表达的蛋白质中的氨基酸数目有关,按照基因编码,一个3N碱基对要求为一个N氨基酸蛋白编码。
原核基因和它的产物等同性意味着一个DNA限制性图谱和一个蛋白的氨基酸图将很好地吻合,这些图是怎样与重组图相符合呢?
共线性的基因和蛋白首先是在大肠杆菌的色氨酸合成酶基因中进行研究的。基因的距离通过突变之间的重组百分比来衡量。蛋白质的距离则由用来代替的单个氨基酸点来衡量。图1.27比较了这两个图,突变的七个点的顺序与相应的用来代替的氨基酸点是相同的,而且重组距离与实际的蛋白的距离相对相似,重组图扩大了一些突变之间的距离,但否则与真实图来比就没有丝毫差别了。
图1.27色氨酸合成酶基因的重组图与蛋白质基因
的序列是一致的。
重组图显示了另外关于基因组合的两点。不同的突变可能造成野生型的氨基酸被不同的替代物所替代,如果两种突变不能结合,它们一定涉及到了在DNA相同位置上的不同突变点,如果这些突变可以在基因图上得到分离,但却影响上图中同样的氨基酸(图中划线处),它们必须在影响氨基酸的不同位置涉及到点突变。这是因为基因重组单位(实际为1bp)小于氨基酸的编码单位(实际为3bp)。
比较一下基因和蛋白,我们被限制在DNA序列上与蛋白相关的点与点之间。然而,基因并不直接翻译成蛋白,而是通过信使RNA(缩短的小型的mRNA)来表达,一个核酸中间的实际上被用来合成一个蛋白(正如我们在第五部分所看到的),信使RNA通过被用来复制的相同的碱基对来合成,所相当不同之处就在于它仅与DNA双螺旋的一个链相联系,图1.28显示了信使RNA的序列与DNA的一条链完全互补(除了用U代替T)且和另一条链完全相同。习惯上DNA序列写注为5'-3',同于RNA链的写法。
图1.28RNA的合成是要以DNA的一条链为模板来补足碱基对的。
信使RNA包括一个核苷酸序列,它与蛋白质中的氨基酸序列相对应,这部分核酸叫做编码区。但是信使RNA在任何一端包括了附加序列;这些序列并不直接代表蛋白。这个区域叫做5'非编码前导序列和3'尾部非编码区。
基因中包含了代表信使RNA的全部序列,有时在无编码区还发现了妨碍基因突变的功能,从而证实了包含有正常基因这个观点的正确性。
图1.29解释了这种情况,这里基因包含有一个连续的用来制造单个蛋白的DNA链。它既包括了用来编码这个蛋白的序列,又包括了另一条链上编码的序列。
图1.29基因可能比编码蛋白序列长。 图1.30基因的表达是一个多步的过程。
一个基因上升到一个蛋白的过程叫做基因的表达。图1.30表述了它的基本过程。第一步是转录,在一个单链DNA的RNA复制中。 在单个基因(一般在细菌内)这个基因其实就是mRNA。对于真核生物的基因,立即复制的基因叫做一个前mRNA,就是被加工后生成的一种成熟的完善的mRNA。
表达中最重要的一步是RNA的剪接。真核生物(大多数是高等真核生物),许多基因包括内部的不复制成蛋白的区域。剪接的过程去掉了一些前mRNA的区域来产生一种能有连续的阅读框架的RNA(见图2.10)。其它的加工结果发生在这步包括前mRNA的5'端和3'端的修饰(见图5.15)。
RNA的转录和加工发生在细胞核中。下一个基因表达的步骤是把mRNA翻译到蛋白质中。这个发生在细胞质中,所以它需要mRNA的运输通过细胞核膜进入细胞质。
翻译是由一个复杂的器官完成的,这个器官包括蛋白质和RNA两个部分。实际上担任过程的“机器”是核糖体,一个大的复杂的,包括了一些大的RNAs(核糖体RNAs,小型的有rRNAs)和许多小蛋白质。氨基酸的识别过程与一个特殊的核苷酸三联体需要一个中间的转运RNA(缩写为tRNA)是一致的,这里每个氨基酸至少有一种tRNA。许多辅助蛋白是螺旋状的。
在这一步要记下来的最重要的是基因表达的过程有RNA的参与,并不仅仅是酶的作用。但也是在器官的组份中为前提,rRNA和tRNA组份被基因翻译并通过复制(就像mRNA,除非这里没有次要的后来的翻译)的过程产生的。
顺式作用位点和反式作用因子
在3章中顺反式互补试验证明了一个基因一个染色体的观点。在一个蝗虫的二倍体上,它的基因带有两个不同的突变,其作用就在于突变决定了是否有一个功能性的等位基因。如果在一个等位基因上所有的突变都是顺式,则另一个等位基因没有突变,是原生型的,但是如果突变是反式的,则每一个等位基因上有一个突变,两个等位基因都是突变体(图1.20所示),现在我们就展开论述,用未定义基因的密码区时顺式和反式的不同,来讨论一个调整的元素与基因之间的联系。
图1.31 DNA中的控制位点供应了蛋白质的结合位点; 图1.32 一个顺式作用位点只能控制
编码区经由RNA的合成来表示。 邻近的编码区,不能影响其它的等位基因。
假设基因表达能力由密码区附近的接合 DNA 的蛋白所控制,在图1.31描述的例子中,只有当蛋白接合DNA时RNA才能合成,假设现在一个突变发生在了这个蛋白所结合的 DNA序列上,以至于这个蛋白不能再识别这个 DNA。结果,这个 DNA就不再能被表达了。
所以一个基因可以被失活,通过调控位点的突变或编码区的突变。通常,这些突变很难区分,因为它们都是在单个等位基因的DNA序列上发生。因此在顺式一反式试验中它们有相同的性质,因此一个调控点上的突变与密码区突变在定义上是相同的。
图1.32显示了一个调控点的缺失仅仅影响它所联系的密码区,并不影响其它等位基因的表达,一个仅仅影响邻近 DNA序列性质的突变叫顺式型。
我们可以把图1.32中的顺式型突变的行为与编码正常蛋白基因的突变做比较。图1.33显示了正常蛋白的缺失将阻碍所有的等位基因的表达,这种突变则叫做反式。
图1.33 蛋白质中一个反式作用点的突变影响了所有
等位基因的表达。
所不同的是,如果一个突变是反式的,则在一个细胞中作用于多靶细胞的可扩散产物(特别是蛋白)就将产生。但是,如果一个突变是顺式的,则一定是通过临近的DNA 来起作用,就是说它不以RNA或蛋白形式来表达。
基因信息可由DNA或RNA来提供
中心法则定义了分子生物学的样式。基因以核酸的序列长期被保存,但功能在蛋白质的组成形式上被表达了。复制在遗传信息中起着重要的作用。转录和翻译对它从一种形式转化成另一种形式起很重要的作用。
图1.34举例说明了复制,转录,翻译所扮演的角色。从中心法则的观点看:
核酸包括了DNA或者RNA两种遗传材料。细胞只用DNA。一些病毒是用RNA,并且病毒RNA的复制发生在受感染的细胞中。
细胞遗传信息的表达一般是单向的。DNA转录产生RNA分子,这种分子只能被进一步运用来产生蛋白质序列,一般来说,他们不能回复来当作遗传信息重复使用。RNA翻译到蛋白一般是不可逆的。
图1.34 中心法则陈述的是核酸中的遗传信息能被保存
和转运,遗传信息转入蛋白质是不可逆的。
核酸中充满了由可变和不可变所结合的基因材料。通过碱基互补原则可以使基因信息的复制被可靠的遗传,同时偶尔突变的发生使遗传发生了改变,为进化提供了材料。基因密码为蛋白质中基因信息的表达提供条件。
这些机制对于原核生物、真核生物或病毒所携带的信息是同等有效的。所有的活着的有机体的基因是由双螺旋DNA组成,病毒的基因组由DNA 或RNA所组成,并且这有一些关于单链(ss)或者双链(ds)的例子。被用来复制核酸的机制细节在病毒中是多样的,但通过合成互补链来复制的机制则是相同的,正如图1.35所示。
图1.35 不管是单链还是双链的核酸的合成都要遵守
碱基互补原则。
通过半保留复制,细胞基因重新生成DNA,双链病毒基因,无论是DNA 或RNA,都通过利用双链中的单链做为摸板来合成另一条链。
有单链基因组的病毒用单链做为模板合成一个互补链,这个互补链被用来合成它的互补链,当然,与先前的互补链相同。复制可能涉及稳定的双链中间产物的生成或者把双链核酸做为一个过渡态。
DNA到RNA的单项运输的限制是不能绝对的。可能会被回复得含有单链RNA分子的遗传物质的病毒所征服。在感染循环中,RNA被反转录进一个单链DNA的过程改变了。这个双螺旋DNA变成细胞基因组的一部分,并像其它基因一样被遗传下来,所以反转录允许一个RNA序列被回复并且以遗传信息再次使用。
RNA复制和反转录的存在证实了一个原则:核酸序列中任一种形式的信息能改变成另一种形式。然而,一般情况下,细胞更信赖DNA回复,转录,翻译的过程。但是在极少的场合(可能中间涉及了一些RNA病毒),信息从一个细胞RNA被改变进入DNA并且把基因组感染。尽管反转录会扮演执行细胞常规命令的角色,但当我们考虑到基因组的进化时,它变成一个有潜在重要性的机制。
这个原则适用于如植物和两栖类的大的基因组到如支原体的小的基因组甚至到更小的DNA或RNA病毒的基因信息。表1.36总结了一些解释基因种类和大小范围的例子。
图1.36 基因组中核酸的数量已经超过了一个巨大的
范围。
所有的活细胞的 DNA基因组由非常长的分子组成;除了细菌和支原体之外都由一个以上这样的分子组成。有些大的病毒(例如流感病毒),它有片段基因,由一个以上的核酸分子组成,其它的病毒基因组组成了单个的核酸分子,对于小的病毒,(SV40,φX,MS2)还有重叠基因的功能。
在所有生物体范围内,基因不同却有100,000范围上的交叠,一个普通的原则非常重要。DNA编码那些生物体细胞必须合成的蛋白,同时蛋白(直接或间接地)提供了细胞生存所需的功能,基因的总数显很难去估计的(在23章中将会详细讲到一个组织)。最小的生物体,支原体,其基因组的大小仅为病毒的两倍。同样病毒的基因信息也是DNA或RNA,核酸编码了那些用于包裹基因和感染过程中用于重新产生宿主细胞的蛋白(最小的随体烟草坏死病毒就不能被单独复制,必须同时需要一个“帮助”病毒:烟草坏死病毒,它是一个传染性的病毒)。
类病毒是在高等植物中造成疾病的传染性物质,它们是很小的RNA颗粒。不象病毒,它的传染性物质由病毒粒子组成,被蛋白所包蚀的基因,病毒RNA也是传染性物质,病毒粒子只由RNA组成,它是如图1.37所示的象典型标准的碱基,杆状结构的突变使它减少了感染性。
图1.37 马铃薯纺锺体微管病毒的RNA是环形分子,而且有广阔的双链结构,经常被内部的环状物中断。轻链和重链不同就在于它们三个核苷酸替代物。
一个类病毒RNA组成了在宿主细胞上自动复制的分子种类,它的序列被永久性地遗传给了后代,类病毒有许多组,一个病毒因与这组中其它病毒序列相似而被分为一组。例如,四个与马铃薯微管病毒有关的病毒在序列上有70~83%的相似性,特别的病毒链的差异影响到了被感染细胞的表现型。例如,马铃薯纺锺体微管病毒的轻链和重链不同就在于它们三个核苷酸替代物。
病毒和类病毒相似性在于核酸基因序列具有遗传性,从而导致突变,并且决定了表现型,它们充分说明了基因表达的判断准则。然而类病毒和病毒在结构和功能上不同,它们有时被叫做病原体病毒。类病毒RNA并不被转移进入蛋白,于是它就不能编码使它存在的功能。这样就有两个问题要解决,类病毒RNA怎样复制呢?它怎样来影响被感染的细胞的表现型呢?
复制的功能是由宿主细胞的酶执行的,与它们正常的功能不同。病毒序列的遗传性暗示了病毒RNA提供了模板。
病原体因干涉正常细胞过程而被称作病原体。它们行动起来可能相对任意一些,例如通过抑制使它们复制的必要的酶或者通过干涉产生必须的RNA。它们代表了不正常的分子,尤其是在单个基因的表达上。
另一种不同的代表是痒病,它是造成山羊和绵羊营养缺失的原因。这种疾病和人类疾病中影响脑功能的病:库鲁病和伊茨费尔特一雅各布综合症有关。
这种痒病的感染性物质表面上不包括任何核苷酸。另一种代表叫蛋白病毒,它是一个28KD的硫水糖蛋白,PrP。PrP编码一个细胞的基因(在哺乳动物中),这个基因在正常大脑中表达,这个蛋白有两种存在形式。在正常脑中发现的叫PrPc ,它被蛋白酶所完全降解。另一种感染大脑的蛋白叫PrPsc,它不被蛋白酶所降解。我们认为一些修饰和构象的改变使得PrPc 和PrPsc得以转换。
这些象痒病和PrPsc为代表的感染性病毒必须通过修饰正常的细胞相应物来具有传染性,缺少PrP基因的小鼠并不得痒病,这就说明PrP是产生这种疾病所必须的。
我们怎样得到这种结论呢?去动物体外合成PrP,在试管中,在细菌中和在被培养的哺乳动物细胞中为分离做了充分的准备。我们需要在试管中由发现PrPc 与PrPsc的转换来得到它们性质的改变,而具有了传染性。
概 要
两个著名的实验证明了DNA是遗传物质。从肺炎球菌一个链中分离出来的DNA可以将其中的性质赋予另一个链上。而且DNA是子代噬菌体从母代继承的唯一成分。最近DNA又被用来向真核细胞转移新的特性。
DNA的双螺旋是由反平行的链构成的,其中核苷酸单位是由5’—3’的磷酸二脂键连接的。主链作为外型;嘌呤和嘧啶以A-T,G-C碱基配对形式堆积于内部。在半保留复制中双链解开并按照碱基配对原则组装成子链。碱基配对原则也适用于RNA转录双链DNA中一条链的过程。
DNA的线性用来编码蛋白质。遗传密码反映了DNA序列与蛋白质序列之间的关系。而双链DNA中只有一条链是编码蛋白质的。并且DNA的编码序列是由一系列有固定起始点的序列组成。一个密码子含有三个核苷酸,这三个核苷酸代表一个氨基酸。
一条染色体是由含有多个基因互不干扰的双链DNA构成。每一个基因(或顺反子)被转录成RNA,如果这个基因编码蛋白那随后这个RNA就翻译成相应的氨基酸序列。基因的RNA或DNA产物产生反式作用。基因可以通过互补检测来确定它在单链线性DNA上的位点。DNA上调节临近基因活性的位点产生顺式作用。
基因可以含有多等位基因。失去功能的等位基因产生隐性基因。无效等位基因就是失去功能的等位基因的总和。而用功能的等位基因产生显性基因。
突变是指DNA的A-T G-C碱基对序列的改变。编码序列的突变,可以引起与它相应蛋白的氨基酸序列的改变。移码突变是插入或删除一个碱基改变阅读框架顺序;在这个突变位点以后将产生一套全新的氨基酸序列。点突变的发生只改变发生突变的密码子产生的氨基酸。点突变可以通过回复突变复原,插入突变可以去掉突变而回复,但是删除突变是不能回复的。
突变的自然发生率可以由诱变剂提高。突变集中在突变热点。典型的突变热点被认为是在修饰过的5-甲基胞嘧啶处发生去氨基作用而产生的点突变。
正突变以每代每座位10-16的速率发生;回复突变几率更小。但并不是所有的突变都对表型产生影响。
虽然所有细胞中的遗传信息由DNA携带,而且病毒可以是双链或单链的RNA或DNA的基因组。但是无壳病毒是低生活力的类病毒,它们仅仅含有小的环形RNA分子,无蛋白质外壳。它们的RNA不是编码蛋白,而它们形成和发病的模式还不清楚。而元病毒则表现为只由蛋白质构成。
第一章 习题
概念题
什么叫做转化?
答:转化:细菌在基因重组作用中,受体细胞染色体内参入了一段提纯的DNA片断。
什么叫做转染?
答:转染(transfection) 在组织培养中,外来DNA导入真核细胞,DNA可以是病毒DNA或其他类型的DNA。
什么是碱基互补配对原则?
答:碱基互补配对原则,在一个双螺旋核酸结构中腺嘌呤必与胸腺嘧啶(或尿嘧啶)形成碱基对,而胞嘧啶必与鸟嘌呤形成碱基对,反之亦然,这一原则广泛适用于DNA-DNA,RNA-RNA和RNA-DNA
什么叫做半保留复制
答:半保留复制:双链DNA的一种复制方式,其亲代链分离,每一子代DNA分子由一条亲代链和一条新合成链组成。是DNA复制的常规模式,每条亲代链均作为合成新的互补链的模板。
什么叫做抑制?
答:抑制(校正):通过在染色体的不同部位上发生的第二次突变,可部分地或全部的恢复(第一次)突变所丧失的基因功能。
什么叫做突变热点?
答:基因上有些位置可以发生数个突变,有的则不发生。有些位点突变的次数远远高于随机碰撞的预期值,可以比随机碰撞的预期值高出十倍甚至一百倍。这些位点称为“突变热点”。
什么叫做等位基因间互补作用
答:在野生型细胞中,活性蛋白质有几个相同的亚基组成,但当一个细胞有两个变异的等位基因时它们的产物以两种不同的亚基聚成蛋白质。两种变异可能有补偿作用,即是单种变异的蛋白质是无活性的。两种变异组成的蛋白质可以是活性的。这种作用叫做等位基因间互补作用。
什么叫做零突变?
答:基因突变导致完全失去基因功能,往往是因为整个基因的缺失,叫零突变。如果这个基因很重要,那么零突变将是致命的。
什么是密码子,阅读框架,移码和抑制因素?
答:与DNA顺序及相应蛋白质顺序密切相关的叫遗传密码
遗传密码中,每三个核苷酸编码一个氨基酸,称为密码子。
如果遗传密码按不重叠的三联体方式解读,那么,把一个核苷酸序列翻译成蛋白质将会有决定于起始位点的三种不同解读方式,称为阅读框架。
插入或缺失一个碱基的突变将改变随后整个序列的阅读框架,这就是所谓的移码。
所有呀啶类试剂诱发的突变可分成两类,用(+)和(-)表示。每一类型的突变自身都导致移码,(+)增加一个碱基,(-)型则除去一个碱基。双突变结合(++)型和(--)仍显示为突变型。但(+-)型或(-+)型的结合则互相抑制,我们称其中一个为另一个的抑制因素。
怎么判断基因和蛋白是共线性的?
答:把一个基因的核苷酸序列和一个蛋白的氨基酸序列来做比较,我们可以直接得出是否这个基因和蛋白是共线性的:是否基因中的核苷酸序列恰好与蛋白质中的氨基酸序列相符合。
什么是编码区?
答:信使RNA包括一个核苷酸序列,它与蛋白质中的氨基酸序列相对应,这部分核酸叫做编码区。
什么是类病毒,特点是什么?
答:类病毒是在高等植物中造成疾病的传染性物质,它们是很小的RNA颗粒。不象病毒,它的传染性物质由病毒粒子组成,被蛋白所包蚀的基因,病毒RNA也是传染性物质,病毒粒子只由RNA组成,它的象典型标准的碱基,杆状结构的突变使它减少了感染性。
简答题:
1 简单描述在有胸腺嘧啶相似物溴脲嘧啶(BraU)混入DNA是怎么导致A.T被G.C取代?
答:溴脲嘧啶具有不确定的配对性质,这是因为溴原子使碱基发生酮式与烯醇式间的转换。烯醇式能与鸟嘌呤配对,形成B-G配对,代替了A-T配对。经过一次复制产生一条G-C配对,而G-C会稳定遗传下去,就使基因产生点突变。
2 已知某一RNA碱基序列为: AGGUAACCGUAGGGGAACCUGCGGUUGGACU ACCUCCUUA3’请依据碱基互补配对写出一种单链内配对的形式,发卡越少越好。
答:AGGUAACCGUAGGGGAACCUGCGGUU GGACU ACCU CCUUA3’
3 简述区分点突变、插入或缺失突变的方法
答:根据它们的回复性。点突变可以通过重建原序列或在基因的其它部位进行一次互补突变得以回复;插入可以通过缺失插入成分得以回复;缺失不可回复。
4 简单解释A和B等位基因在AO和BO杂合子中的显性
答:零突变O型血没有蛋白质功能,但有功能A型和B 型是等显性的。
O(或H)抗原在任何个体中都产生,由特定的碳水化合物基团与蛋白质结合而成。ABO位点携带密码,生成半乳糖基转移酶,O抗原再加一个糖基。这种酶的特异性决定了血型。A型等位基因产生辅助因子UDP—N—乙酰半乳糖,产生A抗原。B型UDP—半乳糖,产生B抗原。A和B的转化酶有四个氨基酸不同,所以辅助因子的作用也不同。O型有一个没有这种功能的变异(一个小的删除),未加工的O型抗原就产生了。
这就解释了A和B等位基因在AO和BO杂合子中的显性,与之相应的转化酶产生了A或B抗原。在AB型杂合子中A和B等位基因等显性。因为两种转化酶都起了作用。OO纯合子没有功能,所以没有以上两种抗体。
5 简述在大肠杆菌中含5-甲基胞嘧啶的位点G•C怎样转换为A•T对的。
答:含5-甲基胞嘧啶的位点已证实为自发突变的突变热点。每次突变,G•C就转换为A•T对。在大肠杆菌中,不发生甲基化的DNA链就没有突变热点。
突变热点的成因是5-甲基胞嘧啶经常发生脱氨基反应。羰基取代氨基使5-甲基胞嘧啶变成胸腺嘧啶。
胞嘧啶脱氨基生成脲嘧啶,而大肠杆菌含有一种脲嘧啶—DNA—糖苷酶,它能将脲嘧啶残基从DNA里除去。反应结果留下未配对的G残基,接着,“修复系统”便会将一个C碱基插入与之配对。反应的最终结果是原DNA的序列将得以保留。也许这套系统正是用来保护DNA以抵抗经常发生的自发的胞嘧啶脱氨基反应。(虽然它没有足够的活性以抵抗亚硝酸的作用)
但5-甲基胞嘧啶脱氨基留下来了。胸腺嘧啶这个碱基是DNA本身所具有的成分,系统无法识别这样的变化,最终发生了突变。这个转化生成一个误配的G•T对,在随后的复制中两者分离,产生一个野生型的G•C和突变型的A•T对。
6 “不重叠”和“特定起始位点”各意味着什么?
答:“不重叠”意味这每个密码子包含三个核苷酸,即一个完整的核苷酸三联体表达一个完整的密码子。
“特定起始位点”意味这蛋白质的合成必须由一端顺序进行到另一端,因此不同部分的编码序列不能分别解读。
7 在一个蝗虫的二倍体上,它的基因带有两个不同的突变,分别说明
答:如果在一个等位基因上所有的突变都是顺式,则另一个等位基因没有突变,是原生型的,但是如果突变是反式的,则每一个等位基因上有一个突变,两个等位基因都是突变体,其作用就在于突变决定了是否有一个功能性的等位基因。
8 什么是顺式型,什么是反式型,以及它们不不同?
答:一个调控点的缺失仅仅影响它所联系的密码区,并不影响其它等位基因的表达,一个仅仅影响邻近 DNA序列性质的突变叫顺式型。正常蛋白的缺失将阻碍所有的等位基因的表达,这种突变则叫做反式。
所不同的是,如果一个突变是反式的,则在一个细胞中作用于多靶细胞的可扩散产物(特别是蛋白)就将产生。但是,如果一个突变是顺式的,则一定是通过临近的DNA 来起作用,就是说它不以RNA或蛋白形式来表达。
问答题
复制,转录,翻译所扮演的角色。
答:从中心法则的观点看:
核酸包括了DNA或者RNA两种遗传材料。细胞只用DNA。一些病毒是用RNA,并且病毒RNA的复制发生在受感染的细胞中。
细胞遗传信息的表达一般是单向的。DNA转录产生RNA分子,这种分子只能被进一步运用来产生蛋白质序列,一般来说,他们不能回复来当作遗传信息重复使用。RNA翻译到蛋白一般是不可逆的。
;点突变与移码突变的区别,请举例说明。
答:密码的特性预见了两种不同形式的异变物会有不同的影响。如果一个特定的序列被另一个序列解读,比如:
UUU AAA GGG CCC (密码)
aa1 aa2 aa3 aa4 (氨基酸)
所以,一个突变点只能影响一个氨基酸。举个例子,A用其他的碱基(X)代替,引起了aa2被aa5取代:
UUU AAX GGG CCC
aa1 aa5 aa3 aa4
是因为只是改变了第二个密码。
但是突变要是插入或者删除一个单个的碱基将使它的阅读框架从突变开始所有的序列都发生改变。这种变化被称为移码。一个核苷酸的增加可能是以这种形式发生:
UUU AAX AGG GCC C
aa1 aa5 aa6 aa7
因为新的三联体顺序已经完全不同于旧的了,蛋白质的所有氨基酸顺序从突变点开始往后都将被改变。所以蛋白质的结构功能很可能全部的丢失。
问题(概念):怎么判断基因和蛋白是共线性的?
把一个基因的核苷酸序列和一个蛋白的氨基酸序列来做比较,我们可以直接得出是否这个基因和蛋白是共线性的:是否基因中的核苷酸序列恰好与蛋白质中的氨基酸序列相符合。
思考题
由于DNA双螺旋链的两条链是反向平行的,因此在复制叉附近解开的DNA链一条是5’--3’方向,另一条是3’--5’方向,两个模板极性不同。已知DNA聚合酶的合成方向都是5’--3’,都不是3’--5’,那怎么解释两条链同时复制呢?
答:具体参见DNA replication一章,主要是因为冈崎片断的存在。