限制性内切酶综述
互联网
- 相关专题
- 限制性核酸内切酶产品选择专题
一般是以微生物属名的第一个字母和种名的前两个字母组成,第四个字母表示菌株(品系)。例如,从Bacillus amylolique faciens H中提取的限制性内切酶 称为Bam H,在同一品系细菌中得到的识别不同碱基顺序的几种不同特异性的酶,可以编成不同的号,如HindII、HindIII,HpaI、HpaII,MboI、MboI等。 限制性内切酶(restriction endonuclease):一种在特殊核甘酸序列处水解双链DNA的内切酶。Ⅰ型限制性内切酶既能催化宿主DNA的甲基化,又催化非甲基化的DNA的水解;而Ⅱ型限制性内切酶只催化非甲基化的DNA的水解。
基本信息
限制性核酸内切酶(restriction endonuclease):识别并切割特异的双链DNA序列的一种内切核酸酶
[别名] Endodeoxyribonuclease
[酶反应] 限制性内切酶能分裂DNA分子 在一限定数目的专一部位上。它能识别外源DNA并将其降解。
[单位定义] 在指明pH与37℃,在0.05mL反应混合物中,1小时消化1μg的λDNA的酶量为1单位。
[性状] 制品不含非专一的核酸水解酶(由10单位内切酶与1μg λDNA,保温16小时所得的凝胶电泳 图谱的稳定性表示)。
性状
限制性核酸内切酶的命名;一般是以微生物属名的第一个字母和种名的前两个字母组成,第四个字母表示菌株(品系)。例如,从Bacillus amylolique faciens H中提取的限制性内切酶称为Bam H,在同一品系细菌中得到的识别不同碱基顺序的几种不同特异性的酶,可以编成不同的号,如HindII、HindIII,HpaI、HpaII,MboI、MboI等。
在生物体内有一类酶,它们能将外来的DNA切断,即能够限制异源DNA的侵入并使之失去活力,但对自己的DNA却无损害作用,这样可以保护细胞原有的遗传信息。由于这种切割作用是在DNA分子内部进行的,故名限制性内切酶(简称限制酶)。限制酶是基因工程中所用的重要切割工具。科学家已从原核生物中分离出了许多种限制酶,并且已经商品化,在基因工程中广泛使用。根据限制酶切割的特点,可将它们分为两大类:一类是切割部位无特异性的;另一类是可特异性地识别核苷酸序列,即只能在一定的DNA序列上进行切割。这种能被特异性识别的切割部位都具有回文序列,也就是在切割部位,一条链正向读的碱基顺序与另一条链反向读的顺序完全一致。在基因工程中使用的多数是后一类酶。限制酶在特定切割部位进行切割时,按照切割的方式,又可以分为错位切和平切两种。错位切一般是在两条链的不同部位切割,中间相隔几个核苷酸,切下后的两端形成一种回文式的单链末端,这个末端能与具有互补碱基的目的基因的DNA片段连结,故称为黏性末端。这种酶在基因工程中应用最多。另一种是在两条链的特定序列的相同部位切割,形成一个无黏性末端的平口。
在基因操作过程中,除了限制酶以外,还要用一系列的酶类,才能完成全过程。例如,碱性磷酸酯酶、DNA多聚酶、末端转移酶、多核苷酸酶、逆转录酶等。这些酶都有各自特殊的催化功能,现在都有商品出售,可以根据不同的需要选用。
简短定义
DNA限制性内切酶:
生物体内能识别并切割特异的双链DNA序列的一种内切核酸酶。它是可以将外来的DNA切断的酶,即能够限制异源DNA的侵入并使之失去活力,但对自己的DNA却无损害作用,这样可以保护细胞原有的遗传信息。由于这种切割作用是在DNA分子内部进行的,故名限制性内切酶(简称限制酶)。
限制性内切酶综述
(Restriction Endonucleases: An Overview)
30多年前,当人们在对噬菌体的宿主特异性的限制-修饰现象进行研究时,首次发现了限制性内切酶。细菌可以抵御新病毒的入侵,而这种"限制"病毒生存的办法则可归功于细胞内部可摧毁外源DNA的限制性内切酶。首批被发现的限制性内切酶包括来源于大肠杆菌的EcoR I和EcoR II,以及来源于Haemophilus influenzae的Hind II和Hind III。这些酶可在特定位点切开DNA,产生可体外连接的基因片段。研究者很快发现内切酶是研究基因组成、功能及表达非常有用的工具。
当限制性内切酶的应用在上世纪七十年代流传开来的时候,以NEB为代表的许多公司开始寻找更多的限制性内切酶。除了某些病毒以外,限制性内切酶只在原核生物中被发现。人们正在从数以千计的细菌及古细菌中寻找新的限制性内切酶。而对已测序的原核基因组数据分析表明,限制性内切酶在原核生物中普遍存在--所有自由生存的细菌和古细菌似乎都能编码限制性内切酶。
限制性内切酶的形式多样,从大小上来说,它们可以小到如Pvu II(157个氨基酸),也可以比1250个氨基酸的Cje I更大。在已纯化分类的4000种限制性内切酶中,已发现了超过250种的特异识别序列。其中有30%是在NEB发现的。对具有未知特异识别序列的限制性内切酶的研究发现工作仍在继续。人们从分析细胞提取物的生化角度研究的同时,也采用计算机分析已知的基因组数据,以期有更多的发现。尽管很多新发现的酶的识别序列与已有的重复--即同裂酶,仍然有识别新位点的酶不断被发现。
上世纪80年代,NEB开始克隆并表达限制性内切酶。克隆技术由于将限制性内切酶的表达与原有细胞环境分离开来,避免了原细胞中其它内切酶的污染,从而提高了酶的纯度。此外,克隆技术提高了限制性内切酶的产量,简化了纯化过程,使得生产成本显著降低;克隆的基因很容易进行测序分析,表达出的蛋白也能进行X射线结晶分析,这使得我们对于克隆产物更加确定。
限制与修饰现象
早在 50 年代初,有许多学者发现了限制与修饰现象,当时称作寄主控制的专一性(host controlled specificity)。 l 噬菌体表现的现象便具有代表性和普遍性,其在不同宿主中的转染频率可说明这一问题(表 2-1)。 l 在感染某一宿主后,再去感染其它宿主时会受到限制。
E.coli 菌株 λ噬菌体感染率
lK lB lC
E.coli K 1 10-4 10-4
E.coli B 10-4 1 10-4
E.coli C 1 1 1
说明 K 和 B 菌株中存在一种限制系统,可排除外来的 DNA 。 10-4 的存活率是由宿主修饰系统作用的结果,此时限制系统还未起作用。而在 C 菌株不能限制来自 K 和 B 菌株的 DNA 。限制作用实际就是限制酶降解外源 DNA ,维护宿主遗传稳定的保护机制。甲基化是常见的修饰作用,可使腺嘌呤 A 成为 N6 甲基-腺膘呤,胞嘧啶 C 成为 5' 甲基胞嘧啶。通过甲基化作用达到识别自身遗传物质和外来遗传物质的目的。
限制酶的发现
在 20 世纪 60 年代,人们就注意到 DNA 在感染宿主后会被降解的现象,从而提出限制性切酶和限制酶的概念。 1968 年,首次从 E.coli K 中分离到限制酶,它有特定的识别位点但没有特定的切割位点,其中切割位点离识别位点达 1000bp 以上。
1970 年,美国约翰·霍布金斯大学的 H. Smith 于偶然中发现,流感嗜血杆菌 (Haemophilus influenzae)能迅速降解外源的噬菌体 DNA ,其细胞提取液可降解 E.coli DNA ,但不能降解自身 DNA ,从而找到 HindⅡ 限制性内切酶。 HindⅡ 限制性内切酶位点和切割位点如下:
5 '… GTPy ↓ PuAC … 3 '
3 '… CAPu ↑ PyTG … 5 '
从此以后,发现的限制酶越来越多,并且许多已经在实践中得到应用。 EcoRⅠ 是应用最广泛的限制性内切酶,酶切位点和切割位点如下:
5' G↓AATTC 3'
3' CTTAA↑G 5'
限制性内切酶的命名遵循一定的原则,主要依据来源来定,涉及宿主的种名、菌株号或生物型。命名时,依次取宿主属名第一字母,种名头两个字母,菌株号,然后再加上序号(罗马字)。如 HindⅢ 限制性内切酶, Hin 指来源于流感嗜血杆菌, d 表示来自菌株 Rd , Ⅲ 表示序号。以前在限制性内切酶和修饰酶前加 R 或 M ,且菌株号和序号小写。但现在限制性内切酶名称中的 R 省略不写。
1986 年下半年发现 615 种限制酶和 98 种甲基化酶; 1998 年发现 10000 种细菌或古细菌中存在 3000 种酶,且酶有 200 多种特异性。到 2005 年 1 月,共发现 4342 种限制酶和甲基化酶,其中限制酶有 3681 种,包括 Ⅰ 型、 Ⅱ 型、 Ⅲ 型限制酶各有 59 、3612 、10 种,甲基化指导的限制酶有 3 种,商业化的限制酶有 588 种,在 Ⅱ 型限制酶中共有 221 种特异性。
限制与修饰系统的种类
根据酶的亚单位组成、识别序列的种类和是否需要辅助因子,限制与修饰系统至少可分为四类。表 2-2 是各种限制与修饰系统的比较。
Ⅱ 型(type Ⅱ)限制与修饰系统所占的比例最大,达 93% 。 Ⅱ 型酶相对来说最简单,它们识别回文对称序列,在回文序列内部或附近切割 DNA ,产生带 3'- 羟基和 5'- 磷酸基团的 DNA 产物,需 Mg2+ 的存在才能发挥活性,相应的修饰酶只需 SAM 。识别序列主要为 4-6bp ,或更长且呈二重对称的特殊序列,但有少数酶识别更长的序列或简并序列,切割位置因酶而异,有些是隔开的。
Ⅱs 型(type Ⅱs)限制与修饰系统,占 5% ,与 Ⅱ 型具有相似的辅因子要求,但识别位点是非对称,也是非间断的,长度为 4-7bp ,切割位点可能在识别位点一侧的 20bp 范围内。
Ⅱ 型限制酶一般是同源二聚体(homodimer),由两个彼此按相反方向结合在一起的相同亚单位组成,每个亚单位作用在 DNA 链的两个互补位点上。修饰酶是单体,修饰作用一般由两个甲基转移酶来完成,分别作用于其中一条链,但甲基化的碱基在两条链上是不同的。
在 Ⅱ 型限制酶中还有一类特殊的类型,该酶只切割双链 DNA 中的一条链,造成一个切口,这类限制酶也称切口酶 (nicking enzyme),如 N.Bst NBI 。
Ⅰ 型(type Ⅰ)限制与修饰系统的种类很少,只占 1% ,如 EcoK 和 EcoB 。其限制酶和甲基化酶 (即 R 亚基和 M 亚基) 各作为一个亚基存在于酶分子中,另外还有负责识别 DNA 序列的 S 亚基,分别由 hsdR 、hsdM 和 hsdS 基因编码,属于同一操纵子(转录单位)。 EcoK 编码基因的结构为 R2M2S 。 EcoB 编码基因的结构为 R2M4S2 。
EcoB 酶的识别位点如下,其中两条链中的 A 为甲基化位点, N 表示任意碱基。
TGundefined(N)8TGCT
EcoK 酶的识别位点如下,其中两条链中的 A 为可能的甲基化位点。
AA°C(N)6GTGC
但是 EcoB 酶和 EcoK 酶的切割位点在识别位点 1000bp 以外,且无特异性。
Ⅲ 型(type Ⅲ)限制与修饰系统的种类更少,所占比例不到 1% ,如 EcoP1 和 EcoP15 。它们的识别位点分别是 AGACC 和 CAGCAG ,切割位点则在下游 24-26bp 处。
在基因操作中,一般所说的限制酶或修饰酶,除非特指,均指 Ⅱ 型系统中的种类。
表2-2:各种限制与修饰系统的比较
Ⅱ Ⅰ Ⅲ
酶分子
内切酶与甲基化酶
分子不在一起
三亚基双功能酶
二亚基双功能酶
识别位点
4-6bp, 大多数为回文对称结构
二分非对称
5-7bp 非对称
切割位点 在识别位点中或靠近识别位点
无特异性,至少在识别位点外 1000bp
在识别位点下游 24-26bp
限制反应与甲基化反应
分开的反应
互斥
同时竞争
限制作用是否需用 ATP
No
Yes
Yes
限制酶识别序列的长度
限制酶识别序列的长度一般为 4-8 个碱基,最常见的为 6 个碱基(表2-3)。当识别序列为 4 个和 6 个碱基时,它们可识别的序列在完全随机的情况下,平均每 256 个和 4096 个碱基中会出现一个识别位点(4^4=256,4^6=4096)。以下是几个有代表性的种类,箭头指切割位置。
4 个碱基识别位点:Sau3AⅠ ↓GATC
5 个碱基识别位点:EcoRⅡ ↓CCWGG
NciⅠ CC↓SGG
6 个碱基识别位点:EcoRⅠ G↓AATTC
HindⅢ A↓AGCTT
7 个碱基识别位点:BbvCⅠ CC↓TCAGC
PpuMⅠ RG↓GWCCY
8 个碱基识别位点:NotⅠ GC↓GGCCGC
SfiⅠ GGCCNNNN↓NGGCC
以上序列中部分字母代表的碱基如下。
R=A 或 G Y=C 或 T M=A 或 C
K=G 或 T S=C 或 G W=A 或 T
H=A 或 C 或 T B=C 或 G 或 T V=A 或 C 或 G
D=A 或 G 或 T N=A 或 C 或 G 或 T
限制酶识别序列的结构
限制酶识别的序列大多数为回文对称结构,切割位点在 DNA 两条链相对称的位置。 EcoRⅠ 和 HindⅢ 的识别序列和切割位置如下。
EcoRⅠ G↓AATTC HindⅢ A↓AGCTT
CTTAA↑G TTCGA↑A
有一些限制酶的识别序列不是对称的,如 AccBSⅠ[CCGCTC(-3/-3)] 和 BssSⅠ[CTCGTG(-5/-1)]。识别序列后面括号内的数字表示在两条链上的切割位置。
AccBSⅠ CCG↓CTC BssSⅠ C↓TCGTG
GGC↑GAG GAGCA↑C
有一些限制酶可识别多种序列,如 AccⅠ 识别的序列是 GT↓MKAC ,也就是说可识别 4 种序列,其中两种是对称的,另两种是非对称的。 HindⅡ 识别的序列是 GTY↓RAC 。
有一些限制酶识别的序列呈间断对称,对称序列之间含有若干个任意碱基。如 AlwNⅠ 和 DdeⅠ ,它们的识别序列如下。
AlwNⅠ CAGNNNC↓TG DdeⅠ C↓TNAG
GT↑CNNNGAC GANT↑C
限制酶切割的位置
限制酶对 DNA 的切割位置大多数在内部,但也有在外部的。在外部的,又有两端、两侧和单侧之别。切点在两端的有 Sau3AⅠ(↓GATC)、NlaⅢ(CATG↓)和 EcoRⅡ(↓CCWGG) 等;在两侧的有 BcgⅠ[(10/12)CGA(N)6TGC(12/10)]和 TspRⅠ(CASTGNN↓), BcgⅠ 酶的切割特性与其它酶不同,它们在识别位点的两端各切开一个断点,而不是只产生一个断点。切点在识别位点外侧的还有 BbvⅠ[GCAGC(8/12)] 和 BspMⅠ[ACCTGC(4/8)] 等。
BcgⅠ ↓10(N)CGA(N)6TGC(N)12↓ TspRⅠ NNCAC(G)TGNN↓
↑12(N)CGA(N)6ACG(N)10↑ ↑NNGTG(C)ACNN
限制酶产生的末端
限制酶产生匹配粘端
(matched ends)
识别位点为回文对称结构的序列经限制酶切割后,产生的末端为匹配粘端,亦即粘性末端(cohesive end),这样形成的两个末端是相同的,也是互补的。若在对称轴 5' 侧切割底物, DNA 双链交错断开产生 5' 突出粘性末端,如 EcoRⅠ ;若在 3'-侧切割,则产生 3' 突出粘性末端,如 KpnⅠ 。
NNG↓AATTCNN EcoRⅠ NNG AATTCNN
NNCTTAA↑GNN NNCTTAA GNN
限制酶产生平末端
(Blunt end)
在回文对称轴上同时切割 DNA 的两条链,则产生平末端,如 HaeⅢ(GG↓CC)和 EcoRV(GAT↓ATC)。产生平末端的 DNA 可任意连接,但连接效率较粘性末端低。
限制酶产生非对称突出端
许多限制酶切割 DNA 产生非对称突出端。当识别序列为非对称序列时,切割的 DNA 产物的末端是不同的,如 BbvCⅠ ,它的识别切割位点如下。
CC↓TCAGC
GGAGT↑CG
有些限制酶识别简并序列,其识别的序列中有几种是非对称的。如 AccⅠ ,它的识别切割位点如下,其中 GTAGAC 和 GTCTAC 为非对称。
GT↓AT/CGAC
CATA/GC↑TG
有些限制酶识别间隔序列,间隔区域的序列是任意的,如 DraⅢ 和 EarⅠ