分子克隆技术
互联网
10521
分子克隆技术通常特指基因克隆(gene cloning)或DNA重组技术(recombinant DNA technology)。基因克隆主要包括:①连接外源基因和克隆载体,构建重组DNA分子,②将重组DNA分子转入受体细胞,使外源基因随受体细胞分裂而得以复制、繁殖。
显而易见,基因克隆是一个比较直观而简单的操作程序。它之所以具有非常重要的生物学意义,是因为这一技术可以为我们提供一个纯粹的基因标本。通常,一个基因总是和细胞里其他基因同在。基因克隆技术诞生之前,我们根本无法纯化单个基因,这意味着我们只能对基因群、而不是特定基因的结构与功能进行研究和开发利用。
构建重组DNA分子是基因克隆实验的第一步,亦即,把环状的载体在指定部位切断,然后把含目的基因的DNA分子插入其中,再将两者连接起来。这一过程需要两种DNA操作酶:限制性内切酶(restriction endonucleases)和连接酶(ligases)。
限制性内切酶能够识别DNA分子上的特定核苷酸序列,并在该处特异性切断DNA分子。例如,Pvu I(细菌Proteus vulgaris 分离)只识别和切断6核苷酸序列CGATCG;从相同细菌分离的Pvu II,却只识别并切断CAGCTG。许多限制性内切酶的识别位点是6个核苷酸,但是,也有识别4个或5个、甚至8个核苷酸顺序的限制性内切酶。此外,有些限制性内切酶的识别顺序可能不是唯一的,例如,Hinf I可以识别并切断GAATC、GATTC,GAGTC和GACTC。因此,通常也将Hinf I的识别位点记为GANTC,N代表A、T、G和C中的任意一种核苷酸。
经限制性内切酶处理后的DNA分子断端有两种:平端和粘端,它们的性质对基因克隆的实验设计有重要影响。其中,具有不同识别位点的限制性内切酶可以产生相同的粘端。例如,Bgl II(AGATCT)和Bam HI(GGATCC)产生与Sau 3A相同的GATC粘端。显然,经上述三种酶处理的DNA分子片断之间均可以在相应的断端形成互补双链。
DNA分子片断通过粘端形成的碱基互补并不能使之相互连接,后一过程需要连接酶的催化作用。所有生物细胞中都产生连接酶,但是,基因克隆中最常用的是T4 噬菌体的连接酶。连接酶催化相邻核苷酸之间形成磷酸二酯键。由于平端不能使DNA片断保持相互接近的位置,因而,和粘端相比,连接酶对平端DNA分子之间连接反应的催化效率较差。
质粒pBR322是一种典型的大肠杆菌克隆载体,它全长仅为4.3kb(通常,我们很难完整地分离和纯化长度超过50kb的DNA大分子)。pBR322带有两种抗生素抗性基因:b -内酰胺酶基因和四环素抗性基因,前者修饰并消除氨苄青霉素对大肠杆菌的毒性。通常,目的基因插入载体质粒将破坏四环素抗性功能。因此,使用含有氨苄青霉素和四环素的培养基,我们可以鉴别大肠杆菌的转化细胞:带有重组质粒的转化细胞只能在含氨苄青霉素、不含四环素的培养基上生长;另一方面,原受体细胞不能在含有氨苄青霉素和四环素的培养基上生长;而有载体质粒但没有目的基因的转化细胞能在含有氨苄青霉素和四环素的培养基上生长。另外,pBR322是一种松弛型质粒,在培养液中加入氯霉素可以使转化细胞中的质粒拷贝数由通常的15个增至1000-3000个,此间,大肠杆菌的染色体并不复制。
实际上,现在经常使用的许多质粒载体不同于pBR322,除抗生素抗性基因之外,这些质粒中的其他基因也可以作为选择基因。例如,pUC8带有氨苄青霉素抗性基因和LacZ / 基因。由于目的基因的插入部位位于LacZ / 基因之内,所以,甄别转化细胞的操作变得更加直观和简单。质粒能使转化细胞在含有氨苄青霉素的培养基上生长,并且,如果同时添加LacZ / 基因表达诱导物质IPTG和LacZ / 酶(b-半乳糖苷酶)的底物X-gal,那么,带有目的基因的转化细胞菌落呈现蓝色,不含目的基因的转化细胞菌落呈现白色。
在细菌中,噬菌体载体是另外一类常用的克隆载体。和质粒不同的是,噬菌体载体通过感染过程即转导进入宿主大肠杆菌细胞。通常,作为克隆载体的噬菌体,都经过一定的突变和缺失处理。因此,这类噬菌体进入大肠杆菌细胞之后,并不像一般噬菌体那样在宿主染色体上整合,而是直接进入裂解周期:大量复制噬菌体、裂解宿主细胞,最终在培养基上形成含有大量噬菌体拷贝的噬菌斑。
筛选带有目的基因的噬菌体的方法多种多样,例如,使用有LacZ / 基因的噬菌体载体时,可以通过X-gal培养基上形成噬菌斑的颜色,区别带有目的基因的重组噬菌体(重组子)和没有目的基因的载体。有时,也可以简单地通过转导前后所形成的噬菌斑形态鉴别重组子。
通常,大肠杆菌及其质粒或噬菌体载体可以充分满足分离和纯化某些实验用基因的目的。但是,我们有时需要用真核生物细胞而不是大肠杆菌细胞作为受体,例如,利用基因克隆控制和促进重要代谢产物(胰岛素等)的合成、改变受体生物的特定性状(将抗虫特性导入粮食作物等),等等。这时,我们必须选择适合于真核细胞的克隆载体。
酵母是基因克隆实验中常用的真核生物受体细胞,培养酵母菌和培养大肠杆菌一样方便。酵母克隆载体的种类也很多。其中,游离型质粒YEps(yeast episomal plasmids)、整合型载体YIps(Integrative yeast vectors)和人工染色体YACs(yeast artificial chromosomes)是三种最具代表性的酵母克隆载体。YEps是一种罕见的真核细胞质粒,大小2mm、长约6kb。YEps在细胞内的拷贝数为70-200个。YEps的性质和细菌质粒载体非常相似,唯一不同的是转化细胞的筛选方法。使用YEps时,主要通过受体细胞营养要求的变化鉴别转化细胞与受体细胞。由于利用YEps克隆的基因容易在细胞继代过程中丢失,因而,人们常用YIps替代YEps。不过,作为酵母菌的克隆载体,YIps的转化频率很低。另一方面,典型的YACs包括一个着丝点、两个端粒、一个复制起点和几个选择标记基因,是一个微型染色体。YACs主要用于克隆长基因或包括数个基因序列的基因组DNA片断。许多重要的动物基因往往含有多个内含子、占据相当长的DNA区域,而使用普通载体通常难以获得完整的基因序列克隆。
在某些特殊的情形中,我们还需要选用动物或植物细胞作为克隆的受体细胞。例如,把克隆的基因导入粮食作物以改善其营养质量等。常用的植物克隆载体主要是Ti质粒及其衍生物;常用的哺乳动物克隆载体主要是一些由大肠杆菌质粒或哺乳类病毒改建的载体。
基因文库(genomic library)是一套包含特定生物体所有基因的DNA序列,其中,不同的DNA序列片段分别被克隆在适当的载体上。例如,人类基因文库是一群带有人类基因克隆的大肠杆菌细胞,我们可以从这个文库中筛选、鉴定和研究任何人类基因。基因文库包括由基因组DNA构成的基因组文库和由与mRNA互补的DNA构成的cDNA文库。cDNA文库不含非转录的基因组序列(重复序列等)。从基因组文库中筛选和鉴定目的基因主要方法是利用各种分子探针手段和DNA侧序仪。
构建基因文库的基本方法是:(1)将特定生物体的基因组DNA或互补DNA分解成适当长度的DNA片段,然后分别与克隆载体连接;(2)通过转化或转导的方法将带有不同DNA片段的重组DNA分子导入受体细胞,获得一套包含特定生物体所有DNA序列的克隆。成功构建基因文库的关键是选择合适的纯化、切断DNA的方法和克隆载体,使所获得的一套DNA序列克隆具有代表性、即不短缺任何DNA片段。例如,在构建基因组文库的过程中,如果某一段基因组DNA序列没能被克隆,那么,该基因组文库便不具有代表性。相似地,如果所建文库中没有足够数量的克隆,那么,肯定会有某些基因缺失。当然,一个完整的cDNA文库也只包括那些与mRNA互补的DNA序列,缺乏不转录的DNA序列。
分离和纯化真核生物基因组DNA时,通常采用蛋白酶分解和相抽提的方法除掉蛋白质及脂类等其他大分子。基因组DNA片段化则主要采用物理剪切法和限制性内切酶法。其中,用搅拌及超声波等物理剪切法处理基因组DNA后,可获得大量较短的DNA随机断片。另一方面,由于各种识别位点在基因组DNA上是非随机分布的,使用不同的限制性内切酶,可以获得具有不同长度分布特征的DNA片段。常用的限制性内切酶有Sau 3A等。
构建基因文库中常用的载体有质粒、噬菌体、粘粒(cosmid)以及YAC。这些载体可以克隆的DNA片段长度上限分别约为10、23、45和1000kb。选择载体的主要参数是基因组大小,即基因组DNA序列的长短。例如,构建大肠杆菌(4.6´ 106 kb)等基因组较小生物的基因组文库时,采用质粒作为载体便可得到满意的结果:按每个DNA片段平均长5kb计算,一个包括5000个DNA片段克隆的基因文库就能够代表一个完整的大肠杆菌基因组序列。构建较大基因组的文库时,噬菌体、粘粒以及YAC常被选作克隆载体。其中,EMBL3和lDASH等噬菌体的衍生物是构建基因组文库中使用最多的载体。
目前,有很多方法能够帮助我们从基因文库的众多克隆中筛选和鉴定带有特定基因的克隆,这些方法大多是以杂交探查技术(hybridization probing)为基础的。杂交探测是一种利用能和目的基因序列互补的DNA或RNA片段为探针,通过分子杂交的手段找出带有目的基因的DNA片段的实验方法。
通常,为了从基因文库中筛选出带有目的基因的克隆,首先,需要将含有基因组DNA或cDNA克隆的菌落或噬菌斑转移到硝酸纤维膜或尼龙膜等支撑物上。进一步,除去DNA以外的其他杂物,同时使DNA分子变性(双链变为单链)并固定在支撑膜上。最后,标记拟使用的探针,并使探针与支撑膜上的单链DNA分子杂交。通过检测杂交膜上的探针信号,我们可以确定带有目的基因的细菌或噬菌体的位置,最终选出相应的基因克隆。
测定DNA序列是决定基因精确结构的唯一方法。DNA测序法主要有链末端终止法(chain termination method)和化学降解法(chemical degradation method)两类。其中,链末端终止法目前使用得最为普遍。
由于DNA测序仪一次只能确定长500-1000bp的核苷酸顺序,因此,通常需要在测序之前,对拟用于序列分析的基因克隆进行亚克隆制备(subcloning)和限制性内切酶图谱绘制工作:把从基因文库中分离的带有目的基因的DNA片段分成若干个小片段,分别克隆后再行测序;根据限制性内切酶图谱确定各个亚克隆DNA片段之间的关系,最终获得完整的基因一级结构信息。
目前,国际DNA数据库主要包括由欧洲生物信息研究所(EBI:European Bioinformatics Institute,英国剑桥)、美国国立生物技术信息中心(NCBI:National Center for Biotechnology Information,美国马里兰)和日本国立遗传学研究所(NIG:National Institute of Genetics,日本静冈)分别运营的EMBL数据库、GenBank数据库和DDBJ数据库组成。它们共同制定和采用相同的数据库管理程序,分别收集、整理并随时交换最新DNA序列信息,定期公布这些信息。此外,所有生物学国际权威性学术刊物都要求投稿者事先在国际DNA数据库登记拟发表的DNA、RNA或蛋白质氨基酸序列,据1999年3月DDBJ的统计数据(表5-1),国际DNA数据库纪录的DNA数据总量已由1967年的121个碱基对跃升为1999年的23亿个碱基对。
按照生物进化的观点,所有基因都是进化的产物。在不同生物种中,具有相同功能的基因通常来源于同一祖先基因。因此,这些基因(orthologous genes)彼此结构相似。显然,比较功能未知的基因和DNA数据库中功能已知基因的序列相似性,我们有可能预测某些基因的功能。
目前,许多研究人员正在DNA数据库的基础上开发新的DNA信息库及其利用系统。例如,NCBI的同源基因信息库COG(clusters of orthologous groups)可以为人们提供详细的同源基因分类和相应的DNA顺序特征;日本的反应途径信息库KEGG(Kyoto encyclopedia of genes and genomes)则提供了一套能够自动比较和预测基因在细胞中的功能的系统。