【共享】RNAi及其应用的研究进展
丁香园论坛
3054
1998年Andrew Fire等[125]首次发现并命名了RNA干扰(RNA interference,RNAi)。RNA干扰是指在真核细胞中引入双链RNA(double-stranded RNA)分子从而导致具有序列同源性的基因产生特异性基因沉默(gene silencing)的现象。属于转录后水平的基因沉默(post-transcriptional gene silencing,PTGS)。该技术的出现为功能基因组学、基因治疗学、药物开发等众多领域带来新的突破,为此2001年被美国科学杂志(Science)评为十大重要科学成就之首,2002年被评为十大科技进步之首。
RNA沉默(RNA silencing)是一种新奇的基因调控机制,通过以下几种方式调控基因的表达水平:介导基因座位的异染色质化,引起转录起始水平的基因沉默;限制转录水平,引起转录水平的基因沉默(transcriptional gene silencing,TGS);激活一种序列特异性的降解过程,引起转录后水平的基因沉默(PTGS/RNAi);介导甲基化,造成被沉默的基因表达水平大幅度降低甚至不表达。TGS和PTGS在机理上相互联系,已成为全世界的研究热点,尤其是与PTGS相关的研究报道如信息爆炸,源源不断。
PTGS最早是在植物中发现的,但是随后研究表明,除酿酒酵母以外的几乎所有真核生物中都发现有RNAi现象的存在,包括原生动物(protozoa)[126-131]、线虫(nematodes)[132-134]、果蝇(fruitflies)[135-137]、家蝇(flies)[138]、昆虫(insect)[139-141]、真菌(fungi)[142-144]、藻类[145]、斑马鱼(zebrafish)[146]、鼠[147,148]和人类[149]细胞。这表明RNAi在进化上高度保守,因此在维持真核细胞的正常生理功能方面可能具有非常重要的作用。RNA相关的基因沉默(RNA-associated silencing)与DNA甲基化(DNA methylation)和组蛋白修饰(histone modifications)已成为引起基因沉默或表达水平下降的三种重要形式。
1 RNAi的发现和定义
RNA沉默是指由RNA介导的通过核酸序列特异性相互作用抑制同源基因表达的现象,它在真核生物中普遍存在。包括植物中的RNAi、共抑制(cosuppression)或者PTGS;真菌中的压制(quelling)现象;动物界的RNAi以及病毒诱导的基因沉默(virus induced gene silence,VIGS)[150]。近期的研究结果揭示,Micro-RNA (miRNA)形成、异染色质化等现象是真核细胞中天然发生的RNAi过程中的一个方面。
1.1 植物中的PTGS
1990年,R.Jorgensen等试图通过导入外源性色素基因来加深牵牛花(petunia)花瓣的颜色,将花青素合成中起作用的查耳酮(chalcone)合成酶基因(chsA)置于一个强启动子p35S控制之下,通过转基因方法导入牵牛花植株中,以获得更多的紫色色素。令人惊奇的是导入的色素基因并未使花的颜色加深,反而使部分花瓣变白[151]。细胞核试验结果证实细胞中的外源性色素基因和内源性色素基因的表达同时受到抑制,chsA mRNA的丧失并不是由于转录水平降低而引起的[152],R.Jorgensen将这种现象称为共抑制(cosuppression)。随后,许多与共抑制相似的现象被相继报道。所有共抑制的相同点是:共抑制全发生在细胞核转录完成之后,结果导致同源的内源性基因和转基因的RNA降解。转录后的降解现象在导入植物、细菌或病毒的基因序列的转基因植物中广泛存在,由此这一现象又被称为转录后基因沉默。研究揭示共抑制并不局限于植物,后生动物和哺乳动物中也广泛存在[153]。
1.2 压制(quelling)
在植物的PTGS现象报道后,在真菌中也发现了同源性依赖的基因沉默现象,称为压制(quelling)。Cogoni,C等[154]将含有能控制橙色色素生产能力基因al-1的质粒导入野生型红色面包霉(Neurospora crassa)菌株中,试图提高色素产生能力,结果正好相反。在丧失了色素产生能力的菌株中,细胞核内转录的基因前体mRNA水平与野生型菌株中前体mRNA一致,但是加工后成熟的基因大大减少,表明以同源性依赖的方式影响成熟mRNA水平并不是由于转录水平的降低所引起,而是基因压制造成的结果。
1.3 RNAi
Andrew Fire等[125]的研究揭开了RNAi现象发现的序幕。早在1995年,康奈尔大学Guo和Kemphues发现用反义RNA能阻断线虫(c.elegans)par-1基因的表达,但是奇怪的是,作为对照的正义链RNA,也同样阻断了该基因的表达。直到1998年华盛顿卡耐基研究院的Andrew Fire等[125]解释了这一现象,正义RNA对基因表达的抑制以及过去利用反义RNA技术对基因表达的阻断,都是由体外转录制备RNA(包括正义RNA和反义RNA)中污染的微量双链RNA(double-stranded RNA,dsRNA)所引起。Andrew Fire和马萨诸塞大学癌症中心的Craig Mello首次将纯化的unc-22一段742nt长由正义链和反义链组成的dsRNA(正义链和反义链的混和物)注入秀丽线虫(Caenorhabditis elegans),结果诱发了比单独注射正义链或反义链都要强得多的基因沉默。随后的实验表明在线虫消化道中注入dsRNA不但可以阻断整个线虫的同源基因表达,而且可以导致其子一代的同源基因沉默。dsRNA能够以同源互补序列的mRNA为靶目标降解特定的mRNA,这个特异性和选择性抑制靶基因表达的过程称为RNAi。这一结果激发了Fire和Timmons的灵感,他们将经过基因工程改造,表达与C.elegans的unc-22基因同源的dsRNA的细菌喂给线虫, 结果惊讶的发现,线虫中出现了unc-22无效的表型。此后的工作又证实, 即使仅将线虫浸泡在含dsRNA 的溶液中,也会诱导RNA i的产生[155]。
1.4 病毒诱导的基因沉默(virus induced gene silence,VIGS)
上述基因沉默现象除外,在受病毒感染的植物中也发现了同源性驱使的RNA降解[156],PTGS既可以由在细胞质中复制的RNA病毒介导所引发,也可以由在细胞质中复制的病毒介导所引发[157]。近一个世纪以前,人们就发现先前感染了中等毒力毒株的植物可以免受亲缘关系较近的强毒株的攻击。但很长一段时间内,人们并不清楚这一交叉保护的机理。研究证实,携带病毒基因序列的转基因植物可以在没有转基因蛋白表达的情况下抵抗病毒的感染[158]。实验结果揭示,在这些抗病毒植株中,转基因的序列在细胞核中都得到高效转录,但细胞质中无规卷曲mRNA的积累水平非常低。进一步的分析证明,一些转基因mRNA可以形成dsRNA,并引发了细胞质中的自身的、其它同源的或互补RNA的序列特异性降解。在抗病毒转基因植株系中,不只是转基因mRNA,包括与其同源的外源基因和入侵的病毒RNA都被降解。此外还有一种VIGS现象是受病毒感染的植株的自身恢复。感染菜花样花叶病毒的芸苔植株会出现明显的症状,可是在40天后,病变减退,50天后竟然长出无症状的新叶。RNA病毒在细胞内复制的过程中产生大量的dsRNA,引发细胞内的PTGS。
2 RNAi的作用机制
2.1 RNAi的发生模式
伴随多个RNAi相关成分的发现,RNAi的作用机制也逐渐清晰。过去近十年的研究结果为揭示RNAi的作用机制提供了重要的实验依据并奠定了基础。目前, 在有关RNAi发生机制的研究中,PTGS是研究的最多、最清楚的一种机制。综合分析体外和体内实验结果,人们提出了RNAi/PTGS现象的机制模型(图1-3-1)。RNAi的发生过程分为两步即RNAi起始阶段和RNAi效应阶段。在RNAi起始阶段,外源性或内源性dsRNA通过Argonaute家族基因编码的蛋白质的识别,在ATP供能的条件下,进一步诱导dsRNA与RNaseⅢ家族成员dsRNA特异性核酶(Dicer)结合。dsRNA被逐步切割为21~23nt的小干扰RNA片断(small interfering RNA,siRNA)[159],在植物细胞中则被切割成21~25nt的siRNA[160],每个siRNA分子包括19~21bp的互补双链及两侧3′末端的2nt的突出端,其5′磷酸基团会被一种特殊的激酶所保护起来,而其3′端羟基是参与RNA依赖性的RNA聚合酶(RNA-Dependent RNA polymerase,RdRP)反应必需的官能基团。进入效应阶段后,siRNA结合于一种不同于Dicer的核酶复合体形成RNA诱导的沉默复合体(RNA-induced silenc- ing complex,RISC)或诱导的转录起始的基因沉默(RNA-induced initiation of transcriptional gene silencing,RITS)复合体;然后在ATP供能的条件下,siRNA 双链解旋,使RISC激活;活化的RISC借助碱基的互补配对锚定于同源的mRNA转录本上,在复合体催化作用下介导RISC切割mRNA。这一切割mRNA的RNA-蛋白复合体(mRNA-cleaving RNA-protein complexes)被称为siRNP(small interfering ribonucleoprotein particles,siRNP)。siRNP的切割位点是在位于指导siRNA的5′端下游11~12nt。根据其对底物的要求和终产物的特性判断,这一核酸酶和Dicer酶是有区别的。最后,被切割的mRNA可能被核糖核酸外切酶降解[135]。
RNAi起始阶段和RNAi效应阶段都可能存在RNAi的扩增过程:在细胞内RdRP的催化下,以siRNA为引物,以目的mRNA为模板,合成大量新的dsRNA,这些新合成的dsRNA又可以作为Dicer的底物而被降解为siRNA,从而使信号得以放大。这一模式在蠕虫的研究中得到了证实;而在果蝇中,还存在着以dsRNA自身为模板合成新的dsRNA的过程,但这种dsRNA会很快的降解掉,所以其作用有限;而且siRNAs本身也可以在RdRP的催化下进行自我复制,所以仅仅几个dsRNA分子就可以产生强大的干涉效应。进入效应阶段后,mRNA降解产物又可以与siRNA的反义链结合,引起新一轮对相应mRNA的降解,所以这一降解过程是正反馈级联放大的,一旦启动就可以加速进行,最终将相应的mRNA全部降解而完全抑制该基因的表达。此外,由于siRNA短小而特异性强,很容易由一个细胞传递到另一个细胞,从而实现RNAi的远距离传输,所以在线虫中,当siRNA穿过生殖腺进入生殖细胞时,RNAi的效应就可以传递给子代。
2.2 RNAi过程所涉及的主要酶和基因
虽然目前对RNAi的中间物、各种RNA-蛋白质复合体以及形成各种复合体的机制了解甚少, 并且对RNAi相关过程中的一些关联过程和RNAi的系统性传播的分子基础也不十分清楚,但是人们却在不断发现基因沉默过程中的必需的共同酶类或因子(表1-3-1),这些由宿主基因编码的蛋白已经被证实参与了基因沉默过程的不同阶段,在基因沉默过程中起着不同的作用,主要包括RdRP、RNAi的起始因子、RNAi的效应因子、RNAi放大因子和RNAi信号传播因子。下面将对RNAi发生所涉及的主要成分进行介绍。
表 1-3-1不同生物中分离的RNAi相关基因
Tab.1-3-1 RNAi-related genes from various organisms
Gene Orgnism References
RNaseⅢ family
Dicer
Dcr1
Dcr2
DCR-1
DCL-1 (CAF/SIN1/SUS1)
Dicer-associated protein
R2D2
RDE-4
HYL1
Argonaute family
eIF2Cs/Grep95
Ago1
Ago2
Aubergine
RDE-1
SGS4
Fragile X family
FMRP
dFXR/dFMR1
Vasa intronic gene
PAI-RBP-1
VIG
F56d12.5/VIG-1
Nuclease
P100
Tudor-SN
F10G7.2/TSN-1
RNase D
MUT-7
DExH box helicase
DRH-1
DRH-2
DEAD box helicase
Spindle E
MUT-14
RNA helicase
Armitage
SMG2
SDE3
Transmembrane protein
SID-1
Putative RdRp
EGO-1,
RRF-1/RDE-9
RRF-3
Rdp1
SGS2/SDE1
SGS3
Homo sapiens
D. melanogaster / S. pombe
D. melanogaster
C. elegans
A. thaliana
D. melanogaster
C. elegans
A. thaliana
Homo sapiens
D. melanogaster/ S. pombe/ A. thaliana
D. melanogaster
D. melanogaster
C. elegans
A. thaliana
Homo sapiens
D. melanogaster
Homo sapiens
D. melanogaster / S. pombe
C. elegans
Homo sapiens
D. melanogaster / S. pombe
C. elegans
C. elegans
C. elegans
C. elegans
D. melanogaster / S. pombe
C. elegans
D. melanogaster
C. elegans
A. thaliana
C. elegans
D. melanogaster
C. elegans
C. elegans
S. pombe
A. thaliana
A. thaliana
161,162
161,163,164
161
161,165
161,166,167
168
168, 169
170
162
171,163,164,172
172
172
171,173,174
175
176, 177
176, 177
176
176
176
178
178
178
179
169
169
180
181, 182
183, 184
185
186
187
183,184
188
189
163,164
181
190
2.2.1 RNA i起始因子
实验证实,C.elegans的两个基因rde-1和rde-4(RNAi deficient,rde)在RNAi的起始过程中起重要作用。携带这些基因的突变体的动物即使注射了dsRNA也不会引起相应基因的沉默,但是如果给这些RNAi缺陷的动物注射来自其正常杂合亲代的siRNA,则它们会重新获得使基因沉默的能力。Rde-1基因是基因家族RDE-1的成员,与链孢酶的qde-2基因(quelling deficient,qde) 和拟南芥的AGO-1基因(argonaute,AGO)同源。虽然这些基因在RNAi或PTGS中的具体作用还未知,但哺乳动物中RDE-1家族的成员已经被证明是翻译的起始因子。有趣的是,拟南芥的AGO-1基因突变体不但存在共抑制缺陷,而且其叶子的发育也存在缺陷,所以,转录后水平的基因沉默过程中的某些步骤或其所涉及的某些酶类可能与生长发育有关[191-193]。
2.2.2 RNAi的效应因子
人们在对杂合突变的蠕虫研究中发现:携带rde-2和mut-7突变体的蠕虫RNAi完全缺陷并表现出较高水平的转座子活性,直接证明了转座子的沉默与RNAi机制的相关性。虽然人们还没确定rde-2的基因产物,但已知mut-7基因编码一种与RNase D的核酶同源的蛋白,该蛋白在人类Werner综合征的发生中起一定的作用, 它可能就是靶RNA降解所必需的核酶活性蛋白的候选蛋白。
2.2.3 RNA依赖性的RNA聚合酶(RdRP)
转基因和受病毒感染的植物显示出积累转基因和病毒的畸形RNA,RdRP可能识别这些畸形RNA,以其作为模板合成反义链RNA而形成dsRNA,合成的dsRNA最终作为靶序列而以序列特异性的方式被降解。目前已有众多实验证明RdRP活性为RNAi所必需,Neurospora crassa(QDE1)[130]和A.thaliana (SDE-1/SGS-2)[194,195]的遗传突变筛选鉴定了与番茄RdRP相似的蛋白是quelling和PTGS效应所必需的;但是同时又有实验证明当编码RdRP的基因发生突变时会产生不同的表型, 从而使RdRP在RNAi过程中的作用变得难以确定。比如C. elegans ego-1的突变体中,RNAi在体细胞中功能正常,但在ego-1最初表达的生殖系细胞中却是缺陷的。Sijen等[196]以C.elegans为实验对象,又将RdRP功能的研究推进了一步,他们发现特异性针对编码融合蛋白GFP-lacZ的lacZ区域的dsRNA不但可以使GFP-lacZ基因沉默, 而且可以使单独的GFP基因也发生表达沉默(GFP-lacZ 蛋白位于核中,而单独的GFP位于线粒体中),从而认为RdRP反应中新合成的dsRNA与起始的dsRNA相比有所扩展,多了目的mRNA5′上游区域的一段序列,而多出来的这段序列在Dicer酶的作用下也会发生降解,降解产物为二级siRNA (secondary siRNA);同样的,secondary siRNA也可以介导相应序列的RNAi效应, 称为过渡RNAi (transitive RNAi)。这种过渡RNAi的效应随着二级靶序列与一级靶序列之间距离的增加而减弱,当距离增加到几百个bp的时候,其效应就变得非常微弱了。同时,他们证明,对于二级siRNA的产生和过渡RNAi的发生,RRF-1基因是必不可少的,而RRF-1基因是C.elegans中RdRP的四个同源基因之一,从而进一步证实了RdRP对于RNAi的发生过程起着举足轻重的作用。
2.2.4 RISC复合体
生成具有催化活性的沉默复合体是RNAi效应发生的关键,包括介导mRNA降解的RISC复合体和与异染色质形成和组蛋白修饰有关从而抑制翻译的RITS复合体。RISC的发现基于Hammond等[135]的研究结果。最新的研究结果证实,RISC包含两个标志性成分:siRNA和Argonaute家族蛋白。Liu J等[167]证实在哺乳动物中存在的多个Argonaute家族蛋白成员在生物学和生物化学特性上有明显区别,在该家族中,只有Argonaute2(AGO2)与mRNA切割活性有关,AGO2大小约130Kda,包含多聚谷氨酸残基、PAZ和PIWI结构域,有Argonaute基因家族的特性。Argonaute家族蛋白成员在多种生物中与基因沉默和发育的控制有关。突变AGO2中隐含的RNase H结构域能使RISC失活;AGO2参与小鼠的发育过程,缺失AGO2的细胞不能产生siRNA诱导的RNAi反应。因此,AGO2是RISC复合体的核心成分,被认为是RNAi的催化引擎。
对古老的PIWI蛋白晶体结构分析显示[198],PIWI蛋白包含两个结构域,类似于lac抑制子的糖结合蛋白和RNase H。该蛋白有一C-端保守区域,是PIWI结构域关键的功能区域,提供与金属离子结合的袋型结构。绝大多数Argonaute家族蛋白序列中两个保守的Asp残基是RNase H的催化残基,在空间上折叠成RNase H样的催化位点。C-端保守的PIWI结构域可能作为5′-磷酸基的siRNA受体,与siRNA结合并确定靶mRNA切割位置。PAZ结构域包含一个变体构象的OB折叠,能与以两个3′-端凸出碱基为特征的siRNA结合。尽管PAZ可能不是Dicer或RISC中核酸的主要结合位点,但它可能促成siRNA和miRNA特异和有效地进入RNAi途径[199]。Song JJ等[220]揭示了火球菌属(Pyrococcus furiosus)Argonaute蛋白的结构特点,三维结构模型显示:Argonaute分子结构模式与PAZ和PIWI的空间构象形成一个与底物的结合槽,能够结合并切割mRNA。
RISC组装的关键步骤是将siRNA双链中的一条链装配进RISC复合体。目前人们只对果蝇RISC复合体装配进行了体外研究,因此人们并不知道从果蝇研究中得到的数据是否适应于其它生物。在果蝇中,siRNA和miRNA由不同的Dicer酶加工;果蝇Dcr-1负责加工miRNA,而Dcr-2负责加工siRNA[201]。Dcr-2也在siRNA单链装配进RISC复合体中起作用。从遗传上,Dcr-2在RISC复合体组装过程中的功能与其在加工siRNA时所起的作用明显不同。Doi等[162]发现缺乏Dicer的人类细胞中,siRNAs不能诱发沉默效应,因此人的Dicer可能在siRNA进入RISC的过程中起作用。相反,在敲除Dicer的ES[202]细胞中,siRNAs能够降低靶基因的表达。这意味着在人类细胞中Dicer只在装配含有AGO2的RISC复合体中是必需的,如同在果蝇中,Dcr-2在AGO2的装配中是必需的。
人们在果蝇RISC复合体装配中提出两个相似的有序途径[184,203]。其一是RISC复合体装配双链siRNA和未知蛋白的结合以形成“复合体B”[184]。在体外,“复合体B”是我们所熟知的RISC装配复合体(RLC)的动态前体。复合体B作为RISC装配路径中早期的媒介物这一理由并不完善,因此人们更支持RLC在siRNA装配进RISC复合体中起重要作用[184,204]。RLC包括蛋白Dcr-2及其伴侣R2D2,R2D2含有串联的双链RNA结合域[184,204]。Dcr-2和R2D2是体内RNAi[201,203,205],RLC的生成以及siRNA的解旋所必需的[184,204]。RLC既包含双链siRNA又有一小部分单链的siRNA,提示siRNA的解旋始于RLC[204]。在秀丽隐杆线虫检测到了Dicer和R2D2样的蛋白-RDE-4,它们和Argonaute蛋白RDE-1存在于同一复合物中。Dicer可能在蠕虫的RISC装配中起作用,RDE-4和R2D2不同,它似乎并不与siRNA结合[169]。
Sontheimer和他的同事们提出RISC装配途径始于复合体R1,然后经过复合体R2到RISC[203]。和RLC一样,复合体R1和R2含有Dcr-2和R2D2。从缺乏Dcr-2的胚胎制备的溶解产物既没有R1也没有R2,Dcr-1是生成miRNA而非siRNA所必需,而缺乏Dcr-1的胚胎能够组装R1但不能组装R2[201,203]。究竟哪一个是与RLC相对应的呢?复合体R1的分子量以及其需要5磷酸化而非ATP提示它和RISC前体中早期检测到的复合体相一致[206]。并且近期的数据提示两种复合体和与siRNA结合的Dcr-2/R2D2 异源二聚体相对应。复合体R2可能与RLC相对应,RLC的装配同时需要Dcr-2/ R2D2和ATP。然而复合体R2在没有ATP的情况下仍然可以生成[203]。
令人感兴趣的是Dcr-1对于复合体R2的生成是必需的。从果蝇S2期细胞中得到的抽提物在Dcr-1耗尽的情况下,仍然可以将长双链RNA切割成siRNA[205]。溶解产物中的Dcr-2和R2D2水平正常。然而,遗传缺失Dcr-1的果蝇胚胎细胞,无论是dsRNA还是siRNA触发的RNAi效应都会下降。很可能是在没有Dcr-1的情况下,RNAi途径所需的其它组分并不稳定,而不是Dcr-1自身是siRNA引导的RNAi所必需的。有外源siRNA存在于溶解产物时,Dcr-1,Dcr-2,和R2D2与80S复合体共沉降,提示它们存在于一个完整的RISC装配体中,这一装配体可以将siRNA和miRNA装配进RISC[203]。与这一观点一致,RISC核心蛋白AGO2及辅助因子dFMR1、TSN和VIG与80S复合体共沉降。这一完整RISC复合体中较大的部分可
能与RISC和核糖体的结合有关。实际上,果蝇RISC中dFMR1直接与核糖体蛋白L5和L11[177]作用。没有添加siRNA溶解产物中,Dcr-1,AGO2,dFMR1,TSN和VIG与80S复合体共沉降,但是不含Dcr-2和R2D2。为何只有外源siRNA存在的情况下Dcr-2/R2D2异源二聚体才会在完整的RISC中出现呢?可能是内源性的小RNAs如miRNAs在体内完整的RISC中生成组装进RISC,而siRNAs则由外源的双链RNA在游离的Dcr-2/R2D2异源二聚体或含有Dcr-2/ R2D2的RLC触发下生成(图1-3-2)。
伴随siRNA解旋的进行,很可能存在于RLC中的Dcr-2/R2D2异源二聚体与RISC核心蛋白AGO2进行交换[204]。AGO2并不被认为是RLC的组成成分,因为没有AGO2时RLC可以照样生成[204]。然而在没有AGO的溶解产物中生成的RLC不包含单链的siRNA,因为AGO2是siRNA解旋所必需的[207]。而且Dcr-2和R2D2在没有AGO2的情况下保持与siRNA稳定结合,似乎AGO2在它们的分离中是必需的。基于人AGO2的Piwi结构域和人的Dicer RNase III结构域之间直接相互作用,含有siRNA的Dcr-2/R2D2 异源二聚体通过与AGO2结合进入完整的RISC中。Dcr-2和AGO2对接可能将来自外源双链RNA的siRNA产物递送给完整的RISC,也许是通过改变AGO2,Dcr-2,R2D2甚至是siRNA的构象从而开始解旋。
除在加工siRNA中起作用外,Dcr-2/R2D2 异源二聚体似乎能够感知siRNA的热力学不对称性,因为这些蛋白在siRNA双链体上的定位反映了双链的哪条链被组装入RISC[204]。对于功能上不对称的siRNAs,异源二聚体在其上的定位主要取决于R2D2,R2D2倾向于与有双链RNA特性的siRNA末端结合。R2D2与5磷酸化的siRNA末端结合得更稳定[204],而5磷酸化的存在并不影响Dcr-2的结合[184,203,204]。因此R2D2也可以鉴定Dicer的加工产物-siRNAs,其两条链都有5磷酸基。R2D2与5磷酸化的siRNA结合的倾向性显示R2D2可能直接与磷酸基基团接触,或可能只是反映RNA:RNA螺旋5磷酸化的稳定效应,这和在siRNA结合蛋白-p19[208]中观察到的结果一样。
缺乏Dcr-2或R2D2的苍蝇没有显示出较大的发育缺陷[201,205],提示这些蛋白不是miRNAs生物发生或起作用所必需的。多数miRNAs在生物发育中起重要的作用,在蠕虫中,与R2D2同源的RDE-4和Argonaute蛋白RDE-1对外源双链RNA的沉默反应是必需的,但在miRNA定向途径中不是必需的。蠕虫和苍蝇通过保持生产和装配siRNA进入RISC独立于miRNA途径,从而阻止外源的双链RNA诱发剂与发育过程中起重要作用的miRNA途径竞争RISC所需的组分。植物中miRNA和siRNA途径也明显不同[209,210]。miRNA的生物发生通过假定有R2D2样感应器可以感应miRNA/miundefined双链体热力学不对称性,那又是啥能感应miRNA的双链体不对称性呢?哺乳动物细胞含有一种Dicer,既能产生miRNA又能产生siRNA。一种R2D2样人Dicer伴侣有待鉴定,但人们认为它能够感应siRNA和miRNA的双链体不对称。然而,苍蝇含有两种Dicer,可能Dcr-1单独感应miRNA双链体的不对称性。不象Dcr-2的PAZ结构域从正规序列漂移而来,Dcr-1含有正规的PAZ结构域。人们认为PAZ基序与单链RNA结合[211-214],因此Dcr-1可能捕捉更具单链特性的miRNA双链体末端。Dcr-1可能存在有待鉴定的双链RNA结合伴侣。Pasha,一种R2D2样的蛋白与Drosha共纯化,Drosha是核糖核酸酶III中一员,将pre-miRNA的原始转录体切割成pre-miRNA并限定了miRNA两端的一端[215-218]。但是Drosha和Pasha被认为在细胞核中起作用,而miRNA装配进RISC则在细胞质中进行。
此外,RNAi过程中还有许多相关基因起着重要作用,不再赘述。目前对于RNAi过程所涉及基因的遗传分析还远远不够, 但新基因的不断发现必将为RNAi发生机制研究的不断深入提供重要的线索。
3 RNAi的重要特性
RNAi作为一种重要的基因表达调控形式,从而诱导基因沉默,主要有以下特性:1)RNAi是转录后水平的基因沉默,在翻译过程中起作用的影响因子对RNAi不产生影响;2)高度的特异性,能够非常特异的以同源性依赖的方式降解与之序列相应的单个内源基因的mRNA,但是dsRNA小片断如小于21~23nt,特异性将显著降低;3)靶mRNA的降解过程需要一系列结构和功能特异的蛋白;4)沉默效率高,相对少量的dsRNA就可以抑制基因表达,使表型达到缺失突变;5)稳定性好,shRNA表达的RNAi具有稳定的特点,不仅可用在哺乳动物细胞上,还可用在整个动物上的基因功能进行深层次的研究。2002年KAY[219]研究小组将体外合成的针对荧光素酶的siRNA和表达对荧光素酶的质粒同时转染成年小鼠的肝脏,成功观察到荧光素酶的表达受到特异的抑制。这是第一篇关于RNAi在哺乳动物整体水平试验研究的报道;6)抑制范围广,RNAi广泛存在于真菌、植物和动物中。它既可抑制单个基因又可以抑制基因家族和整个基因组基因表达,并且可用于试验上较难研究的系统;7)传递性。RNAi抑制基因表达的效应可以突破细胞界限,在不同细胞甚至生物体间长距离传递和维持,并可传递给子代。
RNA沉默(RNA silencing)是一种新奇的基因调控机制,通过以下几种方式调控基因的表达水平:介导基因座位的异染色质化,引起转录起始水平的基因沉默;限制转录水平,引起转录水平的基因沉默(transcriptional gene silencing,TGS);激活一种序列特异性的降解过程,引起转录后水平的基因沉默(PTGS/RNAi);介导甲基化,造成被沉默的基因表达水平大幅度降低甚至不表达。TGS和PTGS在机理上相互联系,已成为全世界的研究热点,尤其是与PTGS相关的研究报道如信息爆炸,源源不断。
PTGS最早是在植物中发现的,但是随后研究表明,除酿酒酵母以外的几乎所有真核生物中都发现有RNAi现象的存在,包括原生动物(protozoa)[126-131]、线虫(nematodes)[132-134]、果蝇(fruitflies)[135-137]、家蝇(flies)[138]、昆虫(insect)[139-141]、真菌(fungi)[142-144]、藻类[145]、斑马鱼(zebrafish)[146]、鼠[147,148]和人类[149]细胞。这表明RNAi在进化上高度保守,因此在维持真核细胞的正常生理功能方面可能具有非常重要的作用。RNA相关的基因沉默(RNA-associated silencing)与DNA甲基化(DNA methylation)和组蛋白修饰(histone modifications)已成为引起基因沉默或表达水平下降的三种重要形式。
1 RNAi的发现和定义
RNA沉默是指由RNA介导的通过核酸序列特异性相互作用抑制同源基因表达的现象,它在真核生物中普遍存在。包括植物中的RNAi、共抑制(cosuppression)或者PTGS;真菌中的压制(quelling)现象;动物界的RNAi以及病毒诱导的基因沉默(virus induced gene silence,VIGS)[150]。近期的研究结果揭示,Micro-RNA (miRNA)形成、异染色质化等现象是真核细胞中天然发生的RNAi过程中的一个方面。
1.1 植物中的PTGS
1990年,R.Jorgensen等试图通过导入外源性色素基因来加深牵牛花(petunia)花瓣的颜色,将花青素合成中起作用的查耳酮(chalcone)合成酶基因(chsA)置于一个强启动子p35S控制之下,通过转基因方法导入牵牛花植株中,以获得更多的紫色色素。令人惊奇的是导入的色素基因并未使花的颜色加深,反而使部分花瓣变白[151]。细胞核试验结果证实细胞中的外源性色素基因和内源性色素基因的表达同时受到抑制,chsA mRNA的丧失并不是由于转录水平降低而引起的[152],R.Jorgensen将这种现象称为共抑制(cosuppression)。随后,许多与共抑制相似的现象被相继报道。所有共抑制的相同点是:共抑制全发生在细胞核转录完成之后,结果导致同源的内源性基因和转基因的RNA降解。转录后的降解现象在导入植物、细菌或病毒的基因序列的转基因植物中广泛存在,由此这一现象又被称为转录后基因沉默。研究揭示共抑制并不局限于植物,后生动物和哺乳动物中也广泛存在[153]。
1.2 压制(quelling)
在植物的PTGS现象报道后,在真菌中也发现了同源性依赖的基因沉默现象,称为压制(quelling)。Cogoni,C等[154]将含有能控制橙色色素生产能力基因al-1的质粒导入野生型红色面包霉(Neurospora crassa)菌株中,试图提高色素产生能力,结果正好相反。在丧失了色素产生能力的菌株中,细胞核内转录的基因前体mRNA水平与野生型菌株中前体mRNA一致,但是加工后成熟的基因大大减少,表明以同源性依赖的方式影响成熟mRNA水平并不是由于转录水平的降低所引起,而是基因压制造成的结果。
1.3 RNAi
Andrew Fire等[125]的研究揭开了RNAi现象发现的序幕。早在1995年,康奈尔大学Guo和Kemphues发现用反义RNA能阻断线虫(c.elegans)par-1基因的表达,但是奇怪的是,作为对照的正义链RNA,也同样阻断了该基因的表达。直到1998年华盛顿卡耐基研究院的Andrew Fire等[125]解释了这一现象,正义RNA对基因表达的抑制以及过去利用反义RNA技术对基因表达的阻断,都是由体外转录制备RNA(包括正义RNA和反义RNA)中污染的微量双链RNA(double-stranded RNA,dsRNA)所引起。Andrew Fire和马萨诸塞大学癌症中心的Craig Mello首次将纯化的unc-22一段742nt长由正义链和反义链组成的dsRNA(正义链和反义链的混和物)注入秀丽线虫(Caenorhabditis elegans),结果诱发了比单独注射正义链或反义链都要强得多的基因沉默。随后的实验表明在线虫消化道中注入dsRNA不但可以阻断整个线虫的同源基因表达,而且可以导致其子一代的同源基因沉默。dsRNA能够以同源互补序列的mRNA为靶目标降解特定的mRNA,这个特异性和选择性抑制靶基因表达的过程称为RNAi。这一结果激发了Fire和Timmons的灵感,他们将经过基因工程改造,表达与C.elegans的unc-22基因同源的dsRNA的细菌喂给线虫, 结果惊讶的发现,线虫中出现了unc-22无效的表型。此后的工作又证实, 即使仅将线虫浸泡在含dsRNA 的溶液中,也会诱导RNA i的产生[155]。
1.4 病毒诱导的基因沉默(virus induced gene silence,VIGS)
上述基因沉默现象除外,在受病毒感染的植物中也发现了同源性驱使的RNA降解[156],PTGS既可以由在细胞质中复制的RNA病毒介导所引发,也可以由在细胞质中复制的病毒介导所引发[157]。近一个世纪以前,人们就发现先前感染了中等毒力毒株的植物可以免受亲缘关系较近的强毒株的攻击。但很长一段时间内,人们并不清楚这一交叉保护的机理。研究证实,携带病毒基因序列的转基因植物可以在没有转基因蛋白表达的情况下抵抗病毒的感染[158]。实验结果揭示,在这些抗病毒植株中,转基因的序列在细胞核中都得到高效转录,但细胞质中无规卷曲mRNA的积累水平非常低。进一步的分析证明,一些转基因mRNA可以形成dsRNA,并引发了细胞质中的自身的、其它同源的或互补RNA的序列特异性降解。在抗病毒转基因植株系中,不只是转基因mRNA,包括与其同源的外源基因和入侵的病毒RNA都被降解。此外还有一种VIGS现象是受病毒感染的植株的自身恢复。感染菜花样花叶病毒的芸苔植株会出现明显的症状,可是在40天后,病变减退,50天后竟然长出无症状的新叶。RNA病毒在细胞内复制的过程中产生大量的dsRNA,引发细胞内的PTGS。
2 RNAi的作用机制
2.1 RNAi的发生模式
伴随多个RNAi相关成分的发现,RNAi的作用机制也逐渐清晰。过去近十年的研究结果为揭示RNAi的作用机制提供了重要的实验依据并奠定了基础。目前, 在有关RNAi发生机制的研究中,PTGS是研究的最多、最清楚的一种机制。综合分析体外和体内实验结果,人们提出了RNAi/PTGS现象的机制模型(图1-3-1)。RNAi的发生过程分为两步即RNAi起始阶段和RNAi效应阶段。在RNAi起始阶段,外源性或内源性dsRNA通过Argonaute家族基因编码的蛋白质的识别,在ATP供能的条件下,进一步诱导dsRNA与RNaseⅢ家族成员dsRNA特异性核酶(Dicer)结合。dsRNA被逐步切割为21~23nt的小干扰RNA片断(small interfering RNA,siRNA)[159],在植物细胞中则被切割成21~25nt的siRNA[160],每个siRNA分子包括19~21bp的互补双链及两侧3′末端的2nt的突出端,其5′磷酸基团会被一种特殊的激酶所保护起来,而其3′端羟基是参与RNA依赖性的RNA聚合酶(RNA-Dependent RNA polymerase,RdRP)反应必需的官能基团。进入效应阶段后,siRNA结合于一种不同于Dicer的核酶复合体形成RNA诱导的沉默复合体(RNA-induced silenc- ing complex,RISC)或诱导的转录起始的基因沉默(RNA-induced initiation of transcriptional gene silencing,RITS)复合体;然后在ATP供能的条件下,siRNA 双链解旋,使RISC激活;活化的RISC借助碱基的互补配对锚定于同源的mRNA转录本上,在复合体催化作用下介导RISC切割mRNA。这一切割mRNA的RNA-蛋白复合体(mRNA-cleaving RNA-protein complexes)被称为siRNP(small interfering ribonucleoprotein particles,siRNP)。siRNP的切割位点是在位于指导siRNA的5′端下游11~12nt。根据其对底物的要求和终产物的特性判断,这一核酸酶和Dicer酶是有区别的。最后,被切割的mRNA可能被核糖核酸外切酶降解[135]。
RNAi起始阶段和RNAi效应阶段都可能存在RNAi的扩增过程:在细胞内RdRP的催化下,以siRNA为引物,以目的mRNA为模板,合成大量新的dsRNA,这些新合成的dsRNA又可以作为Dicer的底物而被降解为siRNA,从而使信号得以放大。这一模式在蠕虫的研究中得到了证实;而在果蝇中,还存在着以dsRNA自身为模板合成新的dsRNA的过程,但这种dsRNA会很快的降解掉,所以其作用有限;而且siRNAs本身也可以在RdRP的催化下进行自我复制,所以仅仅几个dsRNA分子就可以产生强大的干涉效应。进入效应阶段后,mRNA降解产物又可以与siRNA的反义链结合,引起新一轮对相应mRNA的降解,所以这一降解过程是正反馈级联放大的,一旦启动就可以加速进行,最终将相应的mRNA全部降解而完全抑制该基因的表达。此外,由于siRNA短小而特异性强,很容易由一个细胞传递到另一个细胞,从而实现RNAi的远距离传输,所以在线虫中,当siRNA穿过生殖腺进入生殖细胞时,RNAi的效应就可以传递给子代。
2.2 RNAi过程所涉及的主要酶和基因
虽然目前对RNAi的中间物、各种RNA-蛋白质复合体以及形成各种复合体的机制了解甚少, 并且对RNAi相关过程中的一些关联过程和RNAi的系统性传播的分子基础也不十分清楚,但是人们却在不断发现基因沉默过程中的必需的共同酶类或因子(表1-3-1),这些由宿主基因编码的蛋白已经被证实参与了基因沉默过程的不同阶段,在基因沉默过程中起着不同的作用,主要包括RdRP、RNAi的起始因子、RNAi的效应因子、RNAi放大因子和RNAi信号传播因子。下面将对RNAi发生所涉及的主要成分进行介绍。
表 1-3-1不同生物中分离的RNAi相关基因
Tab.1-3-1 RNAi-related genes from various organisms
Gene Orgnism References
RNaseⅢ family
Dicer
Dcr1
Dcr2
DCR-1
DCL-1 (CAF/SIN1/SUS1)
Dicer-associated protein
R2D2
RDE-4
HYL1
Argonaute family
eIF2Cs/Grep95
Ago1
Ago2
Aubergine
RDE-1
SGS4
Fragile X family
FMRP
dFXR/dFMR1
Vasa intronic gene
PAI-RBP-1
VIG
F56d12.5/VIG-1
Nuclease
P100
Tudor-SN
F10G7.2/TSN-1
RNase D
MUT-7
DExH box helicase
DRH-1
DRH-2
DEAD box helicase
Spindle E
MUT-14
RNA helicase
Armitage
SMG2
SDE3
Transmembrane protein
SID-1
Putative RdRp
EGO-1,
RRF-1/RDE-9
RRF-3
Rdp1
SGS2/SDE1
SGS3
Homo sapiens
D. melanogaster / S. pombe
D. melanogaster
C. elegans
A. thaliana
D. melanogaster
C. elegans
A. thaliana
Homo sapiens
D. melanogaster/ S. pombe/ A. thaliana
D. melanogaster
D. melanogaster
C. elegans
A. thaliana
Homo sapiens
D. melanogaster
Homo sapiens
D. melanogaster / S. pombe
C. elegans
Homo sapiens
D. melanogaster / S. pombe
C. elegans
C. elegans
C. elegans
C. elegans
D. melanogaster / S. pombe
C. elegans
D. melanogaster
C. elegans
A. thaliana
C. elegans
D. melanogaster
C. elegans
C. elegans
S. pombe
A. thaliana
A. thaliana
161,162
161,163,164
161
161,165
161,166,167
168
168, 169
170
162
171,163,164,172
172
172
171,173,174
175
176, 177
176, 177
176
176
176
178
178
178
179
169
169
180
181, 182
183, 184
185
186
187
183,184
188
189
163,164
181
190
2.2.1 RNA i起始因子
实验证实,C.elegans的两个基因rde-1和rde-4(RNAi deficient,rde)在RNAi的起始过程中起重要作用。携带这些基因的突变体的动物即使注射了dsRNA也不会引起相应基因的沉默,但是如果给这些RNAi缺陷的动物注射来自其正常杂合亲代的siRNA,则它们会重新获得使基因沉默的能力。Rde-1基因是基因家族RDE-1的成员,与链孢酶的qde-2基因(quelling deficient,qde) 和拟南芥的AGO-1基因(argonaute,AGO)同源。虽然这些基因在RNAi或PTGS中的具体作用还未知,但哺乳动物中RDE-1家族的成员已经被证明是翻译的起始因子。有趣的是,拟南芥的AGO-1基因突变体不但存在共抑制缺陷,而且其叶子的发育也存在缺陷,所以,转录后水平的基因沉默过程中的某些步骤或其所涉及的某些酶类可能与生长发育有关[191-193]。
2.2.2 RNAi的效应因子
人们在对杂合突变的蠕虫研究中发现:携带rde-2和mut-7突变体的蠕虫RNAi完全缺陷并表现出较高水平的转座子活性,直接证明了转座子的沉默与RNAi机制的相关性。虽然人们还没确定rde-2的基因产物,但已知mut-7基因编码一种与RNase D的核酶同源的蛋白,该蛋白在人类Werner综合征的发生中起一定的作用, 它可能就是靶RNA降解所必需的核酶活性蛋白的候选蛋白。
2.2.3 RNA依赖性的RNA聚合酶(RdRP)
转基因和受病毒感染的植物显示出积累转基因和病毒的畸形RNA,RdRP可能识别这些畸形RNA,以其作为模板合成反义链RNA而形成dsRNA,合成的dsRNA最终作为靶序列而以序列特异性的方式被降解。目前已有众多实验证明RdRP活性为RNAi所必需,Neurospora crassa(QDE1)[130]和A.thaliana (SDE-1/SGS-2)[194,195]的遗传突变筛选鉴定了与番茄RdRP相似的蛋白是quelling和PTGS效应所必需的;但是同时又有实验证明当编码RdRP的基因发生突变时会产生不同的表型, 从而使RdRP在RNAi过程中的作用变得难以确定。比如C. elegans ego-1的突变体中,RNAi在体细胞中功能正常,但在ego-1最初表达的生殖系细胞中却是缺陷的。Sijen等[196]以C.elegans为实验对象,又将RdRP功能的研究推进了一步,他们发现特异性针对编码融合蛋白GFP-lacZ的lacZ区域的dsRNA不但可以使GFP-lacZ基因沉默, 而且可以使单独的GFP基因也发生表达沉默(GFP-lacZ 蛋白位于核中,而单独的GFP位于线粒体中),从而认为RdRP反应中新合成的dsRNA与起始的dsRNA相比有所扩展,多了目的mRNA5′上游区域的一段序列,而多出来的这段序列在Dicer酶的作用下也会发生降解,降解产物为二级siRNA (secondary siRNA);同样的,secondary siRNA也可以介导相应序列的RNAi效应, 称为过渡RNAi (transitive RNAi)。这种过渡RNAi的效应随着二级靶序列与一级靶序列之间距离的增加而减弱,当距离增加到几百个bp的时候,其效应就变得非常微弱了。同时,他们证明,对于二级siRNA的产生和过渡RNAi的发生,RRF-1基因是必不可少的,而RRF-1基因是C.elegans中RdRP的四个同源基因之一,从而进一步证实了RdRP对于RNAi的发生过程起着举足轻重的作用。
2.2.4 RISC复合体
生成具有催化活性的沉默复合体是RNAi效应发生的关键,包括介导mRNA降解的RISC复合体和与异染色质形成和组蛋白修饰有关从而抑制翻译的RITS复合体。RISC的发现基于Hammond等[135]的研究结果。最新的研究结果证实,RISC包含两个标志性成分:siRNA和Argonaute家族蛋白。Liu J等[167]证实在哺乳动物中存在的多个Argonaute家族蛋白成员在生物学和生物化学特性上有明显区别,在该家族中,只有Argonaute2(AGO2)与mRNA切割活性有关,AGO2大小约130Kda,包含多聚谷氨酸残基、PAZ和PIWI结构域,有Argonaute基因家族的特性。Argonaute家族蛋白成员在多种生物中与基因沉默和发育的控制有关。突变AGO2中隐含的RNase H结构域能使RISC失活;AGO2参与小鼠的发育过程,缺失AGO2的细胞不能产生siRNA诱导的RNAi反应。因此,AGO2是RISC复合体的核心成分,被认为是RNAi的催化引擎。
对古老的PIWI蛋白晶体结构分析显示[198],PIWI蛋白包含两个结构域,类似于lac抑制子的糖结合蛋白和RNase H。该蛋白有一C-端保守区域,是PIWI结构域关键的功能区域,提供与金属离子结合的袋型结构。绝大多数Argonaute家族蛋白序列中两个保守的Asp残基是RNase H的催化残基,在空间上折叠成RNase H样的催化位点。C-端保守的PIWI结构域可能作为5′-磷酸基的siRNA受体,与siRNA结合并确定靶mRNA切割位置。PAZ结构域包含一个变体构象的OB折叠,能与以两个3′-端凸出碱基为特征的siRNA结合。尽管PAZ可能不是Dicer或RISC中核酸的主要结合位点,但它可能促成siRNA和miRNA特异和有效地进入RNAi途径[199]。Song JJ等[220]揭示了火球菌属(Pyrococcus furiosus)Argonaute蛋白的结构特点,三维结构模型显示:Argonaute分子结构模式与PAZ和PIWI的空间构象形成一个与底物的结合槽,能够结合并切割mRNA。
RISC组装的关键步骤是将siRNA双链中的一条链装配进RISC复合体。目前人们只对果蝇RISC复合体装配进行了体外研究,因此人们并不知道从果蝇研究中得到的数据是否适应于其它生物。在果蝇中,siRNA和miRNA由不同的Dicer酶加工;果蝇Dcr-1负责加工miRNA,而Dcr-2负责加工siRNA[201]。Dcr-2也在siRNA单链装配进RISC复合体中起作用。从遗传上,Dcr-2在RISC复合体组装过程中的功能与其在加工siRNA时所起的作用明显不同。Doi等[162]发现缺乏Dicer的人类细胞中,siRNAs不能诱发沉默效应,因此人的Dicer可能在siRNA进入RISC的过程中起作用。相反,在敲除Dicer的ES[202]细胞中,siRNAs能够降低靶基因的表达。这意味着在人类细胞中Dicer只在装配含有AGO2的RISC复合体中是必需的,如同在果蝇中,Dcr-2在AGO2的装配中是必需的。
人们在果蝇RISC复合体装配中提出两个相似的有序途径[184,203]。其一是RISC复合体装配双链siRNA和未知蛋白的结合以形成“复合体B”[184]。在体外,“复合体B”是我们所熟知的RISC装配复合体(RLC)的动态前体。复合体B作为RISC装配路径中早期的媒介物这一理由并不完善,因此人们更支持RLC在siRNA装配进RISC复合体中起重要作用[184,204]。RLC包括蛋白Dcr-2及其伴侣R2D2,R2D2含有串联的双链RNA结合域[184,204]。Dcr-2和R2D2是体内RNAi[201,203,205],RLC的生成以及siRNA的解旋所必需的[184,204]。RLC既包含双链siRNA又有一小部分单链的siRNA,提示siRNA的解旋始于RLC[204]。在秀丽隐杆线虫检测到了Dicer和R2D2样的蛋白-RDE-4,它们和Argonaute蛋白RDE-1存在于同一复合物中。Dicer可能在蠕虫的RISC装配中起作用,RDE-4和R2D2不同,它似乎并不与siRNA结合[169]。
Sontheimer和他的同事们提出RISC装配途径始于复合体R1,然后经过复合体R2到RISC[203]。和RLC一样,复合体R1和R2含有Dcr-2和R2D2。从缺乏Dcr-2的胚胎制备的溶解产物既没有R1也没有R2,Dcr-1是生成miRNA而非siRNA所必需,而缺乏Dcr-1的胚胎能够组装R1但不能组装R2[201,203]。究竟哪一个是与RLC相对应的呢?复合体R1的分子量以及其需要5磷酸化而非ATP提示它和RISC前体中早期检测到的复合体相一致[206]。并且近期的数据提示两种复合体和与siRNA结合的Dcr-2/R2D2 异源二聚体相对应。复合体R2可能与RLC相对应,RLC的装配同时需要Dcr-2/ R2D2和ATP。然而复合体R2在没有ATP的情况下仍然可以生成[203]。
令人感兴趣的是Dcr-1对于复合体R2的生成是必需的。从果蝇S2期细胞中得到的抽提物在Dcr-1耗尽的情况下,仍然可以将长双链RNA切割成siRNA[205]。溶解产物中的Dcr-2和R2D2水平正常。然而,遗传缺失Dcr-1的果蝇胚胎细胞,无论是dsRNA还是siRNA触发的RNAi效应都会下降。很可能是在没有Dcr-1的情况下,RNAi途径所需的其它组分并不稳定,而不是Dcr-1自身是siRNA引导的RNAi所必需的。有外源siRNA存在于溶解产物时,Dcr-1,Dcr-2,和R2D2与80S复合体共沉降,提示它们存在于一个完整的RISC装配体中,这一装配体可以将siRNA和miRNA装配进RISC[203]。与这一观点一致,RISC核心蛋白AGO2及辅助因子dFMR1、TSN和VIG与80S复合体共沉降。这一完整RISC复合体中较大的部分可
能与RISC和核糖体的结合有关。实际上,果蝇RISC中dFMR1直接与核糖体蛋白L5和L11[177]作用。没有添加siRNA溶解产物中,Dcr-1,AGO2,dFMR1,TSN和VIG与80S复合体共沉降,但是不含Dcr-2和R2D2。为何只有外源siRNA存在的情况下Dcr-2/R2D2异源二聚体才会在完整的RISC中出现呢?可能是内源性的小RNAs如miRNAs在体内完整的RISC中生成组装进RISC,而siRNAs则由外源的双链RNA在游离的Dcr-2/R2D2异源二聚体或含有Dcr-2/ R2D2的RLC触发下生成(图1-3-2)。
伴随siRNA解旋的进行,很可能存在于RLC中的Dcr-2/R2D2异源二聚体与RISC核心蛋白AGO2进行交换[204]。AGO2并不被认为是RLC的组成成分,因为没有AGO2时RLC可以照样生成[204]。然而在没有AGO的溶解产物中生成的RLC不包含单链的siRNA,因为AGO2是siRNA解旋所必需的[207]。而且Dcr-2和R2D2在没有AGO2的情况下保持与siRNA稳定结合,似乎AGO2在它们的分离中是必需的。基于人AGO2的Piwi结构域和人的Dicer RNase III结构域之间直接相互作用,含有siRNA的Dcr-2/R2D2 异源二聚体通过与AGO2结合进入完整的RISC中。Dcr-2和AGO2对接可能将来自外源双链RNA的siRNA产物递送给完整的RISC,也许是通过改变AGO2,Dcr-2,R2D2甚至是siRNA的构象从而开始解旋。
除在加工siRNA中起作用外,Dcr-2/R2D2 异源二聚体似乎能够感知siRNA的热力学不对称性,因为这些蛋白在siRNA双链体上的定位反映了双链的哪条链被组装入RISC[204]。对于功能上不对称的siRNAs,异源二聚体在其上的定位主要取决于R2D2,R2D2倾向于与有双链RNA特性的siRNA末端结合。R2D2与5磷酸化的siRNA末端结合得更稳定[204],而5磷酸化的存在并不影响Dcr-2的结合[184,203,204]。因此R2D2也可以鉴定Dicer的加工产物-siRNAs,其两条链都有5磷酸基。R2D2与5磷酸化的siRNA结合的倾向性显示R2D2可能直接与磷酸基基团接触,或可能只是反映RNA:RNA螺旋5磷酸化的稳定效应,这和在siRNA结合蛋白-p19[208]中观察到的结果一样。
缺乏Dcr-2或R2D2的苍蝇没有显示出较大的发育缺陷[201,205],提示这些蛋白不是miRNAs生物发生或起作用所必需的。多数miRNAs在生物发育中起重要的作用,在蠕虫中,与R2D2同源的RDE-4和Argonaute蛋白RDE-1对外源双链RNA的沉默反应是必需的,但在miRNA定向途径中不是必需的。蠕虫和苍蝇通过保持生产和装配siRNA进入RISC独立于miRNA途径,从而阻止外源的双链RNA诱发剂与发育过程中起重要作用的miRNA途径竞争RISC所需的组分。植物中miRNA和siRNA途径也明显不同[209,210]。miRNA的生物发生通过假定有R2D2样感应器可以感应miRNA/miundefined双链体热力学不对称性,那又是啥能感应miRNA的双链体不对称性呢?哺乳动物细胞含有一种Dicer,既能产生miRNA又能产生siRNA。一种R2D2样人Dicer伴侣有待鉴定,但人们认为它能够感应siRNA和miRNA的双链体不对称。然而,苍蝇含有两种Dicer,可能Dcr-1单独感应miRNA双链体的不对称性。不象Dcr-2的PAZ结构域从正规序列漂移而来,Dcr-1含有正规的PAZ结构域。人们认为PAZ基序与单链RNA结合[211-214],因此Dcr-1可能捕捉更具单链特性的miRNA双链体末端。Dcr-1可能存在有待鉴定的双链RNA结合伴侣。Pasha,一种R2D2样的蛋白与Drosha共纯化,Drosha是核糖核酸酶III中一员,将pre-miRNA的原始转录体切割成pre-miRNA并限定了miRNA两端的一端[215-218]。但是Drosha和Pasha被认为在细胞核中起作用,而miRNA装配进RISC则在细胞质中进行。
此外,RNAi过程中还有许多相关基因起着重要作用,不再赘述。目前对于RNAi过程所涉及基因的遗传分析还远远不够, 但新基因的不断发现必将为RNAi发生机制研究的不断深入提供重要的线索。
3 RNAi的重要特性
RNAi作为一种重要的基因表达调控形式,从而诱导基因沉默,主要有以下特性:1)RNAi是转录后水平的基因沉默,在翻译过程中起作用的影响因子对RNAi不产生影响;2)高度的特异性,能够非常特异的以同源性依赖的方式降解与之序列相应的单个内源基因的mRNA,但是dsRNA小片断如小于21~23nt,特异性将显著降低;3)靶mRNA的降解过程需要一系列结构和功能特异的蛋白;4)沉默效率高,相对少量的dsRNA就可以抑制基因表达,使表型达到缺失突变;5)稳定性好,shRNA表达的RNAi具有稳定的特点,不仅可用在哺乳动物细胞上,还可用在整个动物上的基因功能进行深层次的研究。2002年KAY[219]研究小组将体外合成的针对荧光素酶的siRNA和表达对荧光素酶的质粒同时转染成年小鼠的肝脏,成功观察到荧光素酶的表达受到特异的抑制。这是第一篇关于RNAi在哺乳动物整体水平试验研究的报道;6)抑制范围广,RNAi广泛存在于真菌、植物和动物中。它既可抑制单个基因又可以抑制基因家族和整个基因组基因表达,并且可用于试验上较难研究的系统;7)传递性。RNAi抑制基因表达的效应可以突破细胞界限,在不同细胞甚至生物体间长距离传递和维持,并可传递给子代。