真核基因表达调控
丁香园论坛
1779
真核基因表达调控
一、真核基因组的复杂性
与原核生物比较,真核生物的基因组更为复杂,可列举如下。
▲真核基因组比原核基因组大得多,大肠杆菌基因组约4×106bp,哺乳类基因组在109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有10万个基因。
▲真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。
▲原核生物的基因组基本上是单倍体,而真核基因组是二倍体。
▲如前所述,细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的单元,共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。
▲原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组中仅约10%的序列为蛋白质、rRNA、tRNA等编码,其余约90%的序列功能至今还不清楚。
▲原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。
▲原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物基因组中则存在大量重复序列(repetitive sequences)。用复性动力学等实验表明有三类重复序列:①高度重复序列(highly repetitive sequences),这类序列一般较短,长10-300bp,在哺乳类基因组中重复106次左右,占基因组DNA序列总量的10-60%,人的基因组中这类序列约占20%,功能还不明了。②中度重复序列(moderately repetitive sequences),这类序列多数长100-500bp,重复101-105次,占基因组10-40%。例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3-×105次,在人的基因组中约占7%,功能也还不很清楚。在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成簇重复30-40次,这些基因都可归入中度重复序列范围。③单拷贝序列(single copy sequences)。这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中约占65%。绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因。
从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,使现在国际上制订的人基因组研究计划(human gene project)完成,绘出人全部基因的染色体定位图,测出人基因组109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程。
二、真核基因表达调控的特点
尽管我们现在对真核基因表达调控知道还不多,但与原核生物比较它具有一些明显的特点。
(一)真核基因表达调控的环节更多
如前所述,基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。图19-13扼要地列出真核基因表达的各个可能的环节。
图19-13 真核生物基因表达调控的可能环节
图19-13总结了以前章节叙述过的基因表达过程,并作了一些新补充。图中标出了真核细胞在分化过程中会发生基因重排(gene rearrangement),即胚原性基因组中某些基因会再组合变化形成第二级基因。例如编码完整抗体蛋白的基因是在淋巴细胞分化发育过程中,由原来分开的几百个不同的可变区基因经选择、组合、变化,与恒定区基因一起构成稳定的、为特定的完整抗体蛋白编码的可表达的基因。这种基因重排使细胞可能利用几百个抗体基因的片段,组合变化而产生能编码达108种不同抗体的基因,其中就有复杂的基因表达调控机理。
此外,真核细胞中还会发生基因扩增(gene amplification),即基因组中的特定段落在某些情况下会复制产生许多拷贝。最早发现的是蛙的成熟卵细胞在受精后的发育过程中其rRNA基因(可称为rDNA)可扩增2000倍,以后发现其他动物的卵细胞也有同样的情况,这很显然适合了受精后迅速发育分裂要合成大量蛋白质,需要有大量核糖体。又如MTX(methotrexate)是叶酸的结构类似物,一些哺乳类细胞会对含有利用叶酸所必需的二氢叶酸还原酶(dihydrofolate reductase, DHFR)基因的DNA区段扩增40?00倍,使DHFR的表达量显著增加,从而提高对MTX的抗性。基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机理至今还不清楚。
(二)真核基因的转录与染色质的结构变化相关
真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象:
1.染色质结构影响基因转录 细胞分裂时染色体的大部分到间期时松开分散在核内,称为常染色质(euchromatin),松散的染色质中的基因可以转录。染色体中的某些区段到分裂期后不像其他部分解旋松开,仍保持紧凑折叠的结构,在间期核中可以看到其浓集的斑块,称为异染色质(heterochromatin),其中从未见有基因转录表达;原本在常染色质中表达的基因如移到异染色质内也会停止表达;哺乳类雌体细胞2条X染色体,到间期一条变成异染色质者,这条X染色体上的基因就全部失活。可见紧密的染色质结构阻止基因表达。
2.组蛋白的作用 早期体外实验观察到组蛋白与DNA结合阻止DNA上基因的转录,去除组蛋基因又能够转录。组蛋白是碱性蛋白质,带正电荷,可与DNA链上带负电荷的磷酸基相结合,从而遮蔽了DNA分子,妨碍了转录,可能扮演了非特异性阻遏蛋白的作用;染色质中的非组蛋白成分具有组织细胞特异性,可能消除组蛋白的阻遏,起到特异性的去阻遏促转录作用。
发现核小体后,进一步观察核小体结构与基因转录的关系,发现活跃转录的染色质区段,有富含赖氨酸的组蛋白(H1组蛋白)水平降低,H2A•H2B组蛋白二聚体不稳定性增加、组蛋白乙酰化(acetylation)和泛素化(ubiquitination),以及H3组蛋白巯基化等现象,这些都是核小体不稳定或解体的因素或指征。转录活跃的区域也常缺乏核小体的结构。这些都表明核小体结构影响基因转录。
3.转录活跃区域对核酸酶作用敏感度增加 染色质DNA受DNase Ⅰ作用通常会被降解成00、400……bp的片段,反映了完整的核小体规则的重复结构。但活跃进行转录的染色质区域受DNase Ⅰ消化常出现100-200bp的DNA片段,且长短不均一,说明其DNA受组蛋白掩盖的结构有变化,出现了对DNase Ⅰ高敏感点(hypersensitive site)。这种高敏感点常出现在转录基因的5′侧区(5′flanking region)、3′末端或在基因上,多在调控蛋白结合位点的附近,分析该区域核小体的结构发生变化,可能有利于调控蛋白结合而促进转录。
4.DNA拓扑结构变化 天然双链DNA的构象大多是负性超螺旋。当基因活跃转录时,RNA聚合酶转录方向前方DNA的构象是正性超螺旋,其后面的DNA为负性超螺旋。正性超螺旋会拆散核小体,有利于RNA聚合酶向前移动转录;而负性超螺旋则有利于核小体的再形成。
5.DNA碱基修饰变化 真核DNA中的胞嘧啶约有5%被甲基化为5
一、真核基因组的复杂性
与原核生物比较,真核生物的基因组更为复杂,可列举如下。
▲真核基因组比原核基因组大得多,大肠杆菌基因组约4×106bp,哺乳类基因组在109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有10万个基因。
▲真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。
▲原核生物的基因组基本上是单倍体,而真核基因组是二倍体。
▲如前所述,细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的单元,共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。
▲原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组中仅约10%的序列为蛋白质、rRNA、tRNA等编码,其余约90%的序列功能至今还不清楚。
▲原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。
▲原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物基因组中则存在大量重复序列(repetitive sequences)。用复性动力学等实验表明有三类重复序列:①高度重复序列(highly repetitive sequences),这类序列一般较短,长10-300bp,在哺乳类基因组中重复106次左右,占基因组DNA序列总量的10-60%,人的基因组中这类序列约占20%,功能还不明了。②中度重复序列(moderately repetitive sequences),这类序列多数长100-500bp,重复101-105次,占基因组10-40%。例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3-×105次,在人的基因组中约占7%,功能也还不很清楚。在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成簇重复30-40次,这些基因都可归入中度重复序列范围。③单拷贝序列(single copy sequences)。这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中约占65%。绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因。
从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,使现在国际上制订的人基因组研究计划(human gene project)完成,绘出人全部基因的染色体定位图,测出人基因组109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程。
二、真核基因表达调控的特点
尽管我们现在对真核基因表达调控知道还不多,但与原核生物比较它具有一些明显的特点。
(一)真核基因表达调控的环节更多
如前所述,基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。图19-13扼要地列出真核基因表达的各个可能的环节。
图19-13 真核生物基因表达调控的可能环节
图19-13总结了以前章节叙述过的基因表达过程,并作了一些新补充。图中标出了真核细胞在分化过程中会发生基因重排(gene rearrangement),即胚原性基因组中某些基因会再组合变化形成第二级基因。例如编码完整抗体蛋白的基因是在淋巴细胞分化发育过程中,由原来分开的几百个不同的可变区基因经选择、组合、变化,与恒定区基因一起构成稳定的、为特定的完整抗体蛋白编码的可表达的基因。这种基因重排使细胞可能利用几百个抗体基因的片段,组合变化而产生能编码达108种不同抗体的基因,其中就有复杂的基因表达调控机理。
此外,真核细胞中还会发生基因扩增(gene amplification),即基因组中的特定段落在某些情况下会复制产生许多拷贝。最早发现的是蛙的成熟卵细胞在受精后的发育过程中其rRNA基因(可称为rDNA)可扩增2000倍,以后发现其他动物的卵细胞也有同样的情况,这很显然适合了受精后迅速发育分裂要合成大量蛋白质,需要有大量核糖体。又如MTX(methotrexate)是叶酸的结构类似物,一些哺乳类细胞会对含有利用叶酸所必需的二氢叶酸还原酶(dihydrofolate reductase, DHFR)基因的DNA区段扩增40?00倍,使DHFR的表达量显著增加,从而提高对MTX的抗性。基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机理至今还不清楚。
(二)真核基因的转录与染色质的结构变化相关
真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象:
1.染色质结构影响基因转录 细胞分裂时染色体的大部分到间期时松开分散在核内,称为常染色质(euchromatin),松散的染色质中的基因可以转录。染色体中的某些区段到分裂期后不像其他部分解旋松开,仍保持紧凑折叠的结构,在间期核中可以看到其浓集的斑块,称为异染色质(heterochromatin),其中从未见有基因转录表达;原本在常染色质中表达的基因如移到异染色质内也会停止表达;哺乳类雌体细胞2条X染色体,到间期一条变成异染色质者,这条X染色体上的基因就全部失活。可见紧密的染色质结构阻止基因表达。
2.组蛋白的作用 早期体外实验观察到组蛋白与DNA结合阻止DNA上基因的转录,去除组蛋基因又能够转录。组蛋白是碱性蛋白质,带正电荷,可与DNA链上带负电荷的磷酸基相结合,从而遮蔽了DNA分子,妨碍了转录,可能扮演了非特异性阻遏蛋白的作用;染色质中的非组蛋白成分具有组织细胞特异性,可能消除组蛋白的阻遏,起到特异性的去阻遏促转录作用。
发现核小体后,进一步观察核小体结构与基因转录的关系,发现活跃转录的染色质区段,有富含赖氨酸的组蛋白(H1组蛋白)水平降低,H2A•H2B组蛋白二聚体不稳定性增加、组蛋白乙酰化(acetylation)和泛素化(ubiquitination),以及H3组蛋白巯基化等现象,这些都是核小体不稳定或解体的因素或指征。转录活跃的区域也常缺乏核小体的结构。这些都表明核小体结构影响基因转录。
3.转录活跃区域对核酸酶作用敏感度增加 染色质DNA受DNase Ⅰ作用通常会被降解成00、400……bp的片段,反映了完整的核小体规则的重复结构。但活跃进行转录的染色质区域受DNase Ⅰ消化常出现100-200bp的DNA片段,且长短不均一,说明其DNA受组蛋白掩盖的结构有变化,出现了对DNase Ⅰ高敏感点(hypersensitive site)。这种高敏感点常出现在转录基因的5′侧区(5′flanking region)、3′末端或在基因上,多在调控蛋白结合位点的附近,分析该区域核小体的结构发生变化,可能有利于调控蛋白结合而促进转录。
4.DNA拓扑结构变化 天然双链DNA的构象大多是负性超螺旋。当基因活跃转录时,RNA聚合酶转录方向前方DNA的构象是正性超螺旋,其后面的DNA为负性超螺旋。正性超螺旋会拆散核小体,有利于RNA聚合酶向前移动转录;而负性超螺旋则有利于核小体的再形成。
5.DNA碱基修饰变化 真核DNA中的胞嘧啶约有5%被甲基化为5