遗传作图界标
互联网
1670
常用的遗传标记主要有各种血型,各种蛋白质的电泳行为,蛋白质的氨基酸组成,等位基因和特定的DNA序列等。这些遗传标记在早期构建遗传图时,常用作制图的界标。现在已有很多种作图的界标,现分述于下:
①限制性片段长度多态性(RFLPs) 指用某一种限制性内切酶切割不同个体的DNA时,会产生长度不同的DNA片段,这反映出不同个体来源的DNA序列有差别,当这些差别发生在限制性内切酶的识别序列中时,限制酶就不能再识别这个切割位置,于是就少了一个切割点,切成的DNA片段也就少了一个,但有一个片段的长度却增加了。同样,当DNA的差别造成一个新的识别序列时,限制酶就多了一个切点,切成的片段也就多了一个,但有一个片段的长度缩短了。这种酶切片段数目和长度的变化,可作为一个个体的DNA序列的标记,通过家系中亲代和子代的DNA分析,便可研究其RFLPs的遗传规律,此时的RFLPs就相当于等位基因,可以分析其连锁交换频率而算出其遗传距离,作为遗传图的作图界标。人基因组有105以上的RFLPs界标。RFLPs是反映了基因组DNA的等位片段的多态性。将这种多态性信息与生物体的某一特定表型或性状之间的关系进行连锁分析,就有可能把决定该表型或性状的基因定位在遗传图的某一位置上。
②微卫星DNA多态界标 在基因组DNA中广泛分布着单位长度为6~12个核苷酸的串联重复序列,这些重复单位以正向(头—尾)或反向(头—头,尾—尾)串联成簇。在DNA的某些位置上这种串联成簇的重复单位数目不同。因此,用在串联重复序列两侧切割的限制性内切酶酶切后,就会产生重复单位数目不等的片段。这种数量可变串联重复序列(variablenumber of tandemrepeat,VNTR)的片段长度不同,可作为多态性界标。
短串联重复序列(short tandem repeat,STR)是另一类多态性界标。STR的重复单元长度为2—6个核苷酸。在不同个体的基因组中,这种重复单元的数目变异很大,因而比RFLPs和VNTR有更高的多态性;同时,STR在基因组中的丰度很高,基本上是平均分布并便于用PCR检测,可以大大提高遗传制图的精度。
③单核苷酸多态(single nucleotide polymorphism,SNP)界标 在一个群体中,基因组内某一基因座上可以有两个或两个以上的等位基因,这是等位基因的多态性。同样,在基因组内某一特定核苷酸位置上,也可以有不同的核苷酸。SNP就是指基因组内特定核苷酸位置上存在两种不同的核苷酸且其出现频率大于1%(也有人提出为2%)。换言之,如出现频率低于1%(或2%),则视作点突变。SNP作为单碱基的置换,在群体中只有两种等位型可以检出,就形成双等位标记(biallelic marker),这种界标在人基因组中可多达300万个,平均每1 300 bp就会有一个。因此,3到4个这种相邻的界标构成的单倍型(haplotype)就可以有8~16种。由于两个人的基因组作比较时,平均每1 300个核苷酸中有1个差别,所以这种界标数目极多,覆盖密度大,由此可以大大提高基因组作图和基因定位的精度。
SNP作为一种碱基的置换,大多数是转换,即两种嘌呤间和两种嘧啶间的置换。SNP在CG序列上出现最为频繁,而且多半是C转换成T,因为C常自发地脱氧后成为T。SNP可以人为地划分为两种,一种是遍布在基因组非编码序列中的单核苷酸变异;另一种则是分布在基因编码序列中的SNP,称之为cSNP(coding SNPs)。cSNP或者是“静默的”、“同义的”不改变编码产生的蛋白质;或者是“非同义的”,会改变编码产生的蛋白质的序列,形成了蛋白质的多态性,在功能上有其效应。可是迄今与疾病等直接相关的SNP是很罕见的。cSNP同点突变之间的差别只在于其在群体出现的频率,即上面提到的出现频率大于1%(2%)的归为多态,低于1%(2%)的则归人点突变。
④非多态的短单一序列作为界标 在构建基因组物理图时可以用非多态的长度为300 bp左右的单一序列作为界标。常用的有标定位置序列(sequence tagged site,STS)和表达序列标签(expressed sequence tag,EST)。前者是基因组中的单一DNA序列,后者是某一cDNA分子所特有的一段DNA序列。这种界标可以直接标定在基因组上,并便于用PCR进行验证。EST是代表一种cDNA分子,也就是代表一个基因,但一种cDNA分子或一个基因可以有不止一个EST。由EST构成的图谱,有助于构建转录图或基因图。
①限制性片段长度多态性(RFLPs) 指用某一种限制性内切酶切割不同个体的DNA时,会产生长度不同的DNA片段,这反映出不同个体来源的DNA序列有差别,当这些差别发生在限制性内切酶的识别序列中时,限制酶就不能再识别这个切割位置,于是就少了一个切割点,切成的DNA片段也就少了一个,但有一个片段的长度却增加了。同样,当DNA的差别造成一个新的识别序列时,限制酶就多了一个切点,切成的片段也就多了一个,但有一个片段的长度缩短了。这种酶切片段数目和长度的变化,可作为一个个体的DNA序列的标记,通过家系中亲代和子代的DNA分析,便可研究其RFLPs的遗传规律,此时的RFLPs就相当于等位基因,可以分析其连锁交换频率而算出其遗传距离,作为遗传图的作图界标。人基因组有105以上的RFLPs界标。RFLPs是反映了基因组DNA的等位片段的多态性。将这种多态性信息与生物体的某一特定表型或性状之间的关系进行连锁分析,就有可能把决定该表型或性状的基因定位在遗传图的某一位置上。
②微卫星DNA多态界标 在基因组DNA中广泛分布着单位长度为6~12个核苷酸的串联重复序列,这些重复单位以正向(头—尾)或反向(头—头,尾—尾)串联成簇。在DNA的某些位置上这种串联成簇的重复单位数目不同。因此,用在串联重复序列两侧切割的限制性内切酶酶切后,就会产生重复单位数目不等的片段。这种数量可变串联重复序列(variablenumber of tandemrepeat,VNTR)的片段长度不同,可作为多态性界标。
短串联重复序列(short tandem repeat,STR)是另一类多态性界标。STR的重复单元长度为2—6个核苷酸。在不同个体的基因组中,这种重复单元的数目变异很大,因而比RFLPs和VNTR有更高的多态性;同时,STR在基因组中的丰度很高,基本上是平均分布并便于用PCR检测,可以大大提高遗传制图的精度。
③单核苷酸多态(single nucleotide polymorphism,SNP)界标 在一个群体中,基因组内某一基因座上可以有两个或两个以上的等位基因,这是等位基因的多态性。同样,在基因组内某一特定核苷酸位置上,也可以有不同的核苷酸。SNP就是指基因组内特定核苷酸位置上存在两种不同的核苷酸且其出现频率大于1%(也有人提出为2%)。换言之,如出现频率低于1%(或2%),则视作点突变。SNP作为单碱基的置换,在群体中只有两种等位型可以检出,就形成双等位标记(biallelic marker),这种界标在人基因组中可多达300万个,平均每1 300 bp就会有一个。因此,3到4个这种相邻的界标构成的单倍型(haplotype)就可以有8~16种。由于两个人的基因组作比较时,平均每1 300个核苷酸中有1个差别,所以这种界标数目极多,覆盖密度大,由此可以大大提高基因组作图和基因定位的精度。
SNP作为一种碱基的置换,大多数是转换,即两种嘌呤间和两种嘧啶间的置换。SNP在CG序列上出现最为频繁,而且多半是C转换成T,因为C常自发地脱氧后成为T。SNP可以人为地划分为两种,一种是遍布在基因组非编码序列中的单核苷酸变异;另一种则是分布在基因编码序列中的SNP,称之为cSNP(coding SNPs)。cSNP或者是“静默的”、“同义的”不改变编码产生的蛋白质;或者是“非同义的”,会改变编码产生的蛋白质的序列,形成了蛋白质的多态性,在功能上有其效应。可是迄今与疾病等直接相关的SNP是很罕见的。cSNP同点突变之间的差别只在于其在群体出现的频率,即上面提到的出现频率大于1%(2%)的归为多态,低于1%(2%)的则归人点突变。
④非多态的短单一序列作为界标 在构建基因组物理图时可以用非多态的长度为300 bp左右的单一序列作为界标。常用的有标定位置序列(sequence tagged site,STS)和表达序列标签(expressed sequence tag,EST)。前者是基因组中的单一DNA序列,后者是某一cDNA分子所特有的一段DNA序列。这种界标可以直接标定在基因组上,并便于用PCR进行验证。EST是代表一种cDNA分子,也就是代表一个基因,但一种cDNA分子或一个基因可以有不止一个EST。由EST构成的图谱,有助于构建转录图或基因图。