CRISPR
生物学霸
4242
生物界一系列惊人的发现改变了这个学科,也让生物学家们以前所未有的方式对细胞上下其手。当然,这要感谢原核生物们进化出的这一套稀奇古怪的免疫系统。一系列的研究揭示出了细菌这一免疫系统的运作方式,并很快挖出名为 Cas9 蛋白的幕后黑手,一个受 RNA 引导的 DNA 内切酶。疯狂的科学家们很快发现了 Cas9 蛋白编辑基因组的潜在能力,并做出了一系列的探索。
两年前,一些研究表明通过 Cas9 蛋白和向导 RNA 的在真核细胞中共表达,可以实现位点特异性的 DNA 编辑,到如今上千篇相关文献相继发表发表 (图 A),这项技术如同病毒一般广泛又迅速的传播到世界各地,并且随着时间推移,这项技术也出现了许多革新与优化。
CRISPR 序列的生物学功能依然不够明确
1987 年,科学家们首次在大肠杆菌中发现了 CRISPR 基因,并且随后在 40% 的细菌中和 90% 的古细菌体内发现了类似序列。2005 年,CRISPR 序列与抗噬菌体的免疫作用联系起来。整个 CRISPR-Cas9 获得性免疫系统通路大致分为三个步骤:获得 CRISPR 序列-产生 CRISPR RNA-干扰目标 DNA 片段。
在获得阶段,从外源性 DNA 获得新的间隔片段,并插入到 CRISPR 基因座的末端。然后 RNA 前体从 CRISPR 基因座上转录出来并加工成成熟的 crRNAs(CRISPR-RNAs),然后被一个或多个 Cas9 蛋白结合,形成核糖核蛋白靶向复合物,包含有一个引导序列。最终,Cas 蛋白会把与 crRNA 互补的序列切割降解。
CRISPR-Cas 免疫系统又被分为三种不同类型,又根据 cas 基因的发展史,分为数目可观的亚型。Ⅰ型和Ⅲ型的系统仅仅需要 crRNA 进行序列引导,而Ⅱ型系统会用到反式激活的 crRNA(tracrRNA)。
除此之外,crRNA-Cas 蛋白复合体中蛋白组成也是高度可变的,Ⅰ型和Ⅲ型的系统通常会有超过 8 个亚基组成蛋白复合体,而相反的是,Ⅱ型系统仅仅需要一个多肽 (Cas9) 就能工作。
由 RNA 引导的 Cas9 靶向 DNA
Cas9 是一个 DNA 限制性内切酶,能够在与引导 RNA 互补的 DNA 上产生双链切口 (DSBs)。理所当然,Cas9 蛋白的功能也取决于引导 RNA。
而引导 RNA 由 crRNA 和 tracrRNA 两部分组成,crRNA 的 5』末端与目标 DNA 互补,而在 3』末端与 tracrRNA 形成双链促进 Cas9 蛋白的募集。因为 DNA 靶向作用是由 DNA-RNA 之间配对来完成的,改变 RNA 的序列就可以轻松改变系统的靶向特异性 (图 B)。
高效的靶向作用还需要目标 DNA 序列近侧存在一个短结构域,被称为是前间区序列邻近基序 (PAM),通过特异性选择 PAM 结构附近的序列,CRISPR-Cas9 免疫系统就能够区分出哪些是自身的序列,哪些不是。
DNA 序列上存在 PAM 结构就会被剪切,而 CRISPR 自身基因座上的序列,同样也能被引导 RNA 识别并结合,但因为不存在 PAM 结构,所以不会被 Cas9 蛋白切割。
CRISPR-Cas9 基因编辑系统
简单概括 CRISPR-Cas9 技术,就是 sgRNA 引导序列设计为在目的序列 NGG 结构的上游 20 个碱基的互补序列。同时将 Cas9 蛋白和 sgRNA 用慢病毒或者质粒进行转染、或者直接注射 DNA/RNA,甚至直接转染蛋白复合体等。
Cas9 蛋白就能靶向感兴趣的基因座,并产生双链切口 (DSBs),然后切口会被细胞本身的修复机制所修复。
非同源末端连接修复 (NHEJ) 就是其中一种,而 NHEJ 是一种易错修复途径,通常会引起少量插入或者缺失突变,开放阅读框 (ORF) 就会被破坏,这个基因就被灭活了。
同源重组修复 (HDR),通过在 Cas9-sgRNA 组分中加入一个供体 DNA,供体 DNA 上带有靶向位点侧翼的同源序列,DSBs 的修复会以供体 DNA 为模板进行。
这项技术允许我们在感兴趣的基因里添加新的序列,比如抗原表位标签,还能特异性的产生定向突变,比如对引起疾病的基因进行修复或者模仿。然而,HDR 的效率是远低于 NHEJ 的,需要进行更多的改进和探索来提高它的效率。
CRISPR-Cas9:一个多才多艺的 DNA 结合系统
Cas9 蛋白产生的 DNA 双链断裂 (DSBs),是由两个蛋白结构域来实现的 (HNH 和 RuvC),通过点突变使这两个结构域失活,就能得到一个保留了靶向 DNA 结合能力而无催化活性的 Cas9 蛋白 (dCas9)。
当 dCas9 与 sgRNA 在细菌中共表达,它们能结合在启动子上把 RNA 聚合酶挤开,从而使特定转录本表达量下降。(图源自维基)
而通过在 Cas9 上嵌合一些特定的效应分子,也许可以开发出更稳定高效的真核生物基因表达调控系统,比如转录阻遏子和激活子,通过 sgRNA 的引导到达相应的基因座。
在 dCas9 上融合 GFP 蛋白,就可以在活细胞中观察到相应的 DNA 座位,为基因组的形态观察及动力学研究提供一种独特的方式。
dCas9 与表观遗传效应分子的融合,使这个系统能够特异性干扰表观遗传修饰。新近的研究还报道了 dCas9 系统还可以以单链 RNA 为靶点,对细胞中 RNA 转录子的操作也将成为可能。
CRISPR-Cas9 系统的脱靶效应
许多基因工程技术的成功,不论是作为一个研究工具还是临床应用上,都会收到其特异性的限制,CRISPR-Cas9 系统也不例外。
sgRNA 的 20 个碱基的序列特异性会显著影响系统的特异性,尤其是靠近 PAM 序列的错配,发生错配将最大程度的影响系统的切割效率。
为了应对 CRISPR-Cas9 系统的脱靶效应,科学家们搞了许多黑科技。
首先,一种 Cas9 蛋白的切口酶变体,突变了 HNH 和 RuvC 的其中一个结构域的活性,一对 sgRNA 引导 Cas9 蛋白在目的 DNA 临近的两个位置上形成切口,模拟双链切割。
如果单个 sgRNA 引起了脱靶切割,只会引起双链 DNA 的单链断裂,修复 DNA 单链断裂不会引起插入或缺失突变。因此大幅度降低了脱靶效应。
9z47wt_small.jpg" style="width: 585px; height: 178px;"/>
其次,将 dCas9 蛋白与 FokI 进行融合,与 ZFNs 和 TALENs 类似,一对 sgRNA 引导 dCas9-FokI 到临近的两个靶点上,当 FokI 蛋白形成二聚体时,Cas9 蛋白才会产生 DSB,而 FokI 单体存在时,dCas9-FokI 不具有切割活性。
最后,在不牺牲特异性的条件下,使用更短的 sgRNA 会降低脱靶效应,而且不会影响到系统的编辑效率。