PCR-聚合酶链反应的进展(转)
丁香园论坛
1967
PCR-聚合酶链反应的进展
北京大学第一医院 朱 平
在聚合酶链反应(PCR)的方法建立以前,面院DNA长链上某种基因的变化有很大难度。1983年由Kry Mullis 等利用当时已经发现的DNA聚合酶,首先建立的体外DNA序列扩增法,基本方法是用寡核苷酸引物扩增位于两个已知序列之间的DNA序片段。反应在DNA聚合酶催化下完成。引物的序列分别与模板基因的序列互补,分别结合在模板DNA对应的两条单链的目的基因的两端随着引物序列从5’~3’延伸合成。在过量的两种引物的四种dTTP,dATP,dCTP,dGTP存在的情况下,模板ONA通过加热而变性,然后冷却到一定温度,两个引物退火,结合到了对应的模极序列上。DNA聚合酶使退火后结合在模板上的引物开始延伸。随后,反复重复变性,退火,DNA延伸等合成步骤。由于每一次扩增后的产物又可充当下一循环的模板,所以每一次循环基本上都能使靶DNA产物的量扩增一倍。1985年,Saiki用这种方法检测时常发生于非洲黑人中的镰刀红细胞贫血获得了成功。PCR从此进入实用阶段。由于PCR操作相对不很复杂,应用前景广阔,因此短短几年已经广泛渗透到医学各个阶段,发表论文和专著数以千计。
迄今各种PCR的实验方法虽然有一些改进变化,但是基本原理是一致的。PCR的主要产物是双链DNA,在目的基因两端设计了两条特异性的引物,引物的5’末端限定了扩增的目的序列的长度,其长度等于两引物间的距离。在PCR过程中,第一循环扩增产生的DNA大小是不均一的,其长度可以超出两个引物结合部位间距离。在第二循环后,以第一循环产物为模板所扩增出的DNA分子的长度便固定了,并在以后的循环中以成倍速度积累,成为PCR的产物尽管在每一循环中,以起始的DNA为模板所产生的较长片段的产物也仍在不断的扩增,但它们是以线性方式增加,因此对最终产物的影响不明显。
1983年设计的PCR操作是用E.olic DNA聚合酶的Klenow段催化延伸过程。由于这种酶在PCR变性时的高温下失活,所以在每一循环中的合成步骤之前,都需要加入新鲜的酶。耐热性Taq DNA聚合解决了这个问题。Taq聚合酶是从嗜热菌(Thermusaquaticus)中纯化出来的。可耐95℃的水浴温度,在变性步骤中不失活。因此不需要在每一循环后重新加入新鲜的酶。因为引物的退火和延伸可以在较高的温度广进行,引物的错误启动作用大大减少,从本质上改善了扩增反应的特异性、效率及扩增产物的长度。仅仅用0.5μg的模板DNA,经30~35周期的循环后,就可以获得0.5~1μg的靶序列DNA产物,序列长度可达12kb。
PCR在遗传性疾病的诊断,临床标本中病原体检查,法医学标本的遗学鉴定(来源于毛发或单个精细胞的DNA),分析被激活的痛基因的突变情况都有应用。这些应用都进于从PCR基本技术中扩展的一系列研究方法。这些方法已经作为各种分子克隆技术和DNA分析的基本技术,可以用于:1.用微卫星做染色体基因定位,寻找基因缺失。2.获得特异性序列基因表达生产蛋白或者作为分子探针。3.从微量mRNA中产生cDNA文库。已经发展了直接比较正常和遗传变异基因的方法。4.用于直接序列测定分析。5.获得基因片段分析基因突变,SSCP,DGGE,异源双链形成。目前已经用PCR做基因的定量分析。
一、用微卫星确定染色体的基因丢失
最近发现,用微卫星序列确定遗传性变异基因的存在与否和位置变化,足很有用的方式。微卫星(Microstellite)是广泛分布于不同染色体上的一些简单重复序列,通常由2~4个核苷酸反复重复排列组成。每个个体同一等位基因上这种序列重复的次数不同,故序列的长度不同,呈多态性。迄今已发现6000余个微卫星序列。自1992年起,法国人开始将微卫星序列作为标志物之一做基因图谱,将染色体上的基因划分开来,每个标志物之间的距离缩小到了1000kb,称为第二代基因图谱。近年人们利用微卫星序列研究遗传病基因的突变和丧失取得了很多进展,由于微卫星序列已被定位于各个染色体上,每条染色体可被微卫星分成若干区域,根据这些微卫星标记,可以将致病基因的位置定出并局限于最小范围。如果发现一个家系有2例同样一种遗传性疾病,就可以用微卫星序列做基因的连锁分析,定位克隆出未知的致病基因。与遗传有关的基因许多已经通过微卫星克隆或定位。寻找家族易感基因的基本方法是连锁分析(Linkage analysis)法,即在获得遗传性疾病的家系后,取得不同家族成员(包括正常人和患者)的血样品,提取DNA,以位于不同染色体位点的微卫星结构作为标志物,分析每个成员在不同位点的状态,比较同一位点上不同成员的状态,如果发现在同一位点上家族中患者总是共有同样的等位基因,则意味着该处可能存在致病基因,在相邻部位进一步取微卫星做上述研究,则可将基因定位并克隆。现在已经有现成的克隆基因的试剂盒,内容包括23对染色体上各10~20个微卫星位点的荧光标记引物,检测基因组200~400个基因定位点,如果发现哪些基因与患者表型连锁,就可以进一步做细致的定位克隆。
许多遗传病,肿瘤都发现存在微卫星序列的杂合性丢失(LOH)和不稳定性(MSI)现象。杂合性丢失(loss of heterozygosity,LOH)现象是来自父亲或母亲一方的等仪基因发生了缺失。如果发现某一肿瘤有许多病例孜某一染色体位点有较高的LOH发生率,往注标志这一位点存在这种肿瘤的抑癌基因。大约75%的大肠癌显示有染色体17p和18q的LOH,50%的大肠癌显示有5q的LOH,后来发现5q上的APC/MCC、17P上的p53以及18q上的DCC是抑癌基因。据报告5q21的LOH可发生在21%~40%的非小细胞肺癌、80%的小细胞肺癌以及77%的食管癌中。散发性大肠癌中DCC位点LOH的发生率为71%。消化道癌中有61%显示有DCC基因LOH,18q的LOH可出现在64%的骨肉瘤、60%的卵巢癌、33%的肾肿瘤、11%的肺癌。在散发性乳癌中,5q21(APC/MCC基因)的LOH发生率是28%;18q21(DCC基因)的LOH发生率是31%;17p13(P53基因)的发生率是71%,以上三个位点中,2个或2个以上位点发生LOH的几率是24%。
由于DNA错配修复(DNA mismatch repair)功能的损害所造成的DNA不稳定性也可能是遗传病和肿瘤产生的原因之一。不稳定性可表现在微卫星在DNA复制后出现长度的变化,即微卫星结构的不稳定性(Microstellite instability,MSI),这些长度的变化是由于细胞分裂时DNA复制过程中新合成的链在模板上沿复制方向向前或向后滑动所造成的,脆性X综合征,强直性肌营养不良等许多遗传病与基因不稳定有关。肿瘤只是瘤细胞出现变异,将同一病人的肿瘤及正常组织DNA进行微卫星结构的PCR扩增电泳,用肿瘤DNA所形成的区带与正常组织相比,如果肿瘤组织DNA可产生多余的条带,则表示肿瘤中存在遗传不稳定性或称修复错误(repair error,RER)。最早发现遗传性非息肉性大肠痈(hereditory non-polosis colorectal cancer,HNPCC)有MSI,近来在非遗传性大肠癌甚至其它肿瘤(包括胰腺癌,胃癌,乳腺癌,前列腺癌等)也发现MSI现象。在HNPCC中,MSI发生宰高达80%~90%,散发大肠癌发生率较低,为15~40%。在其它散发性癌中,胰腺癌MSI发生率较高(66.7%),留癌为38石%,但在低分化胃痫中高达64%。食管鳞癌3p微卫星MSI的发生率为60%。卵巢癌9q上一个位点以上MSI的发生率为59%,前列腺癌MSI的发生率为37.5%,低分化腺癌为63.6%,D期转移癌为46.7%,与高中分化癌有统计学差异。在非上皮肿瘤中MSI报合不多。MSI是出现在某些染色休上的某些基因还是影响所有的基因尚无定论。
微卫星作为多态性标记,因其在染色体上有明确的定位,可以广泛用于克隆新的遗传病相关基因和肿瘤的抑癌基因、预测发病趋势、评价治疗效果和估计预后,为基因在染色体细致定位提供了一个新工具。
二、PCR检测单核营酸多态性
人类基因组后计划除了研究基因组结构与功能以外,将以人类致病基因组和药物敏感基因组为研究的重点。研究致病和药物敏感性基因组不仅具有极其重要的理论价值,而且亦有十分重要的实际意义和社会经济效益,其中单核苷酸多态性(Single Nucleotide Polymorphism,SNP)的分析是主要的研究途径和方法。用单核苛酸多态性做基因分析是从1998年刚刚发展起来的,特指人类基因组中大量存在的单个核苷酸的变异。正常人不同个体的核苷酸序列都有一定的差异,它决定了不同人种和群体的差异,目前推断人基因组至少有30万个SNP,基因上每500bp~1000bp就有一个SNP。与所谓第二代基因图谱的微卫星串连重复序列相比,SNP是一个具有高度稳定性的遗传学标记,是一种新一代的人类基因标记。SNP不仅是人类种族和个体差异的标记,亦是决定不同人群疾病、易感性和药物治疗敏感性的标记,可以成为寻找疾病相关基因,进行疾病诊断、预防和药物筛选的基础。
目前SNP研究主要包括2个方面:一是确定人类究竟有多少SNP,从1999年的文献报告分析,多数研究上利用基因库资料和序列标签位点(STS)在不同染色体上分段工作,基本方法包括PCR直接扩增相关基因后测序,SSCP,异源双链分析,探针杂交,限制酶分析等,许多实验方法已经有了自动化仪器。为了加速进展,有些先进实验室开始利用基因芯片,一次分析更多的位点。在国际互连网络上已经建立了很多SNP网站供研究者查询和比较。二是直接利用一些患病家系,选择与该两致病有关的候选基因上的SNP做连锁分析。例如Halushka 1999年6月报告高血压病75个候选基因上874个候选SNP,认为一些SNP与发病有关;Mein 1998年报铅分析394个糖尿病家系的染色体6上的MHC附近候选致病基因和位于染色体10、16等上致病候选基因的SNP,通过SNP寻找致病基因。Becker l999年用SNP分析自身免疫病的候选基因,认为与补体C6、7、8无关。候选送因上的SNP均依据作者以往工作的经验或者通过计算机查询国际一些大基因库进行比较分析后选择。
三、定量PCR
在病毒所致的疾病,与基因表达剂量有关的遗传病以及肿瘤的微小残留病的检测中,要动态观测和分析患者体内的基因表达情况,及时了解病情的发展趋势,PCR的定量显得尤为重要。定量分析用PCR反应结束时的DNA含量来推测模板DNA的量,通常用正常稳定表达的基因如β-actin做内参标,因此进行这种分析是基于一个前提假设:混合反应体系内内参标和检测基因的扩增效率一致。在混合体系的PCR的反应中存在两种现象制约了扩增效率的一致性:短片段优先扩增和平台效应:由于达到扩增平台的时间很可能不一致,如一个片段已达到平台,而另一片段还能继续扩增,则此时终止反应,扩增效率必然不一致。因此要想定量尽量精确,必须满足一些条件,各条片段的长度不能有过大的差异,扩增时的循环次数不能过多。
一般说来,PCR反应体系里加入一对扩增看家基因(如:β-actin)的引物,然后对电泳胶银染,所得的图象扫描后用计算机进行处理,得到各个条带密度的相对数值,大致可反映体内各种基因所占的比例。此种方法的主要缺陷是无法克服PCR的平台效应。PCR产物行毛细管电泳后经计算机处理可行到代表不同DNA组份的峰,其峰下面积即为其含量的数值。这种方法比银染后扫描相对精确一些,其缺陷仍是无法克服PCR的平台效应。
荧光定量PCR最常用的荧光标记方法是用荧光标记引物的5’端,在反应过程中荧光素整合到PCR产物中,反应结束后可经电泳检测荧光强度,现在更常用全自动荧光DNA分析系统(如PE公司的373A或377)来自动分析。这种分析可以在反应进行中而不必等到反应完成后进行,在一定程度上克服了平台效应。国外已用于临床,国内由于其价格昂贵,尚未广泛应用。在混合DNA标本中各等位基因扩增效率相同的前提下,只要循环次数相对较少,PCR产物的量与模板DNA的含量之间存在线性关系。如果不同条带之间的扩增效率存在差异,则此线性关系就不精确,此时结果就需要校正。
四、常用的PCR其他方法
1.序列分析:序列分析的方法有Maxam-Gilbert化学裂解法和更常用的Sanger双脱氧末端终止法两种。PCR可产生用于Sanger序列分析的模板。PCR反应结束后,用微量浓缩器透析除去过量的dNTP和引物。用32P标记的新引物对扩增的DNA进行序列分析。扩增反应后残留的引物有可能干扰双脱氧核苷酸末端终止法测序反应。末标记的引物与标记的引物争夺PCR-DNA产物的的结合位点,并能延伸。为了去除这些与标记引物竞争的旧引物,可经先将扩增的DNA用凝胶电泳纯化,以避免这类问题。
2.突变分析:通过扩增产物的大小可以检测某一部位的缺失或插入。用带有缺失位点的引物进行PCR反应,如果扩增,便可推测有缺失存在。还可通过SSCP,放射性标记的RNA探针杂交,数种引物同时进行PCR等来检测点突变。
3.多重PCR:多重PCR(multiple PCR)是在一次反应中加入多种引物,同时扩增一份DNA样品中不同基因位点的不同序列。设计引物时使获得的产物序列的长短不同,有固定的大小。根据不同长短的序列在与否,检测是否有某些基因片段的缺失与突变。多重PCR常用于检测X-联锁遗传病杜氏肌营养不良的dystrophin蛋白的缺失。该基因的缺失集中于9个易发热点区,加人多种引物的反应液(多重PCR)扩增这些易缺失基因,电泳观察是否有一区带缺失,可以检测出80%以上的杜氏肌营养不良症。G-6-PD缺乏症是最常见的红细胞酶缺乏症,在我国南方有些省份G-6-PD活性降低者高达6%。中国台湾学者同时用8对引物扩增G-6-PD基因的第2~13外显子,然后克隆相应片段并测序,确定了4种点突变。一些多重PCR可以用特异性探针做DNA杂交,以确定PCR是否成功。
4.筑巢法PCR:筑巢法PCR(nested-primer PCR)是先用一对外侧引物扩增获得的基因的一些大片段,再用第二套内侧引物以大片段为模板再扩增。通常先用外侧引物扩增若干周期,再加入内侧引物,使PCR效率大大增加。一些治疗后的白血病血液和骨髓中残留白血病细胞仅占所有有核细胞中很小的比例,比如1%以下,相对异常基因拷贝数较少。筑巢法PCR可以提高PCR的效率和特异性,常常用于检测淋巴细胞白血病的免疫球蛋白基因重排;慢性粒细胞白血病的bcr/abl基因和早幼粒白血病的pml/RARα基因。一般用外侧引物扩增30周期,然后取出10%的反应产物放置新试管,新试管有全套反血液和新内侧引物,再扩增30周期。筑巢法所以用同位素探针检测,因为必须与4种引物结合才队获得阳性结果,因此特异性很强。
5.反向PCR:PCR可以扩增位于两引物之间的DNA片段,但用反向PCR(inverse PCR)可以扩增已知序列区间以外的序列。用限制性内切酶将基因组DNA完全消化,但目的序列上没有这个酶的切割位点,目的序列的片段通常短于2~3kb;然后稀释DNA,使其在适当的条件下连接成单环状。由于Taq DNA聚合酶对线状DNA的扩增效果较好,多数实验者选用仅在已知序列区内存在一个内切酶消化,使单环重新线性化。无论线状或环状模板,都可用与已知序列5’末端互补的引物,扩增已知序列以外的区域。扩增反应的主要产物是线状双链DNA,原先的已知序列分别为DNA的头一尾部的序列。其上、下游序列顶端的连接点是原先用于消化基因组DNA的P8’性内切酶的酶切位点。反向PCR用于快速扩增已知序列以外的未知DNA片段。因此,反向PCR可用于探索邻接已知序列的其他染色体序列。
6.双温PCR:双温PCR(two-temperature PCR)仅仅执行2步温度程序。标准PCR需要3步温度程序,第一步高温,使天然双链DNA热变性;第二步降温,使引物退火连接在和它互补的模板DNA上;第三步是中温,理论上这时引物延伸,合成新的互补DNA序列。实际上,只要有足够的超量的dNTP和退火的引物,Taq酶可以在温度升降过程中使引物延伸。如果仅仅合成35~100bp左右的序列,引物退火温度的要求范围可以高于或者低于理论温度5~10℃,引物浓度和Taq酶也不很要紧。合并退火与延伸温度,用双温PCR可能比用严格的温度更能提高反应速度和特异性。一般常用温度是94~95℃和46~47℃。
五、PCR操作中的污染
PCR强有力的地方恰巧也是它的弱点所在。由于PCR技术十分敏感,很可能在扩寸曾获得目的基因的同时,由于样本和扩增片段的蓄积,形成潜在的污染因素。通常典型的PCR反应可以产生1012扩增拷贝。因此,很小的一点雾状飞沫可以含有1015潜在的目的基因。有项研究发现,将100μl PCR产物放人一个奥大匹克标准化游泳池,那么每0.1ml的游泳池水中将含40个扩增产物分子。白血病的残留病以及一些感染性疾病诊断都需要最大的敏感性,要求能扩增少量样品DNA中1~10个模板分子。为了尽可能避免污染造成的假阳性,应当注意以下几个方面:(1)每次PCR都要设阶性和阴性对照。(2)将PCR和PCR后的操作分离进行。一定不要在加模板DNA的房间打开PCR后的反应管的盖。(3)用下压移液器和带过滤咀的移液器。(4)PCR反应试剂分成最小包装,每次分别使用,不重复用。(5)经常用紫外灯照射,破坏小DNA片段。较早进行PCR的实验室都遇到过了话染的问题,因此从开始就建立正确的操作程序,有利于今后的工作。然而,很多临床试验室受一定限制,没有一定的条件和空间防止污染。难以避免假阳性,一些新操作法可去除PCR产物的污染。一个是用酶学方法,一个是用光照方法。
用UNG做PCR前处理(酶学法)利用UNG的方法是在反应液中加入一种细菌的酶,叫N-糖基尿嘧啶酶(Uracil N glycosylase UNG)。这种酶能够切除连接碱基和磷酸糖基骨架间的N-糖基,因此能切去DNA的尿嘧啶。这种方法是在做PCR时,用dUTP代替dTTP,扩增产物中所有T的位置被取代。在下次PCR前,先加入UNG孵育,以前污染的含dUTP的PCR产物都被UNG酶降解,但不会影响正常DNA模板。UNG在94℃高温下灭活。应当强调指出,只有在一开始做PCR试验就采用这种方法才会有效,因为要求所有PCR产物都含dUTP。如果已经有某种PCR产物污染了实验室,再做同样的试验就无效了。
光化学法做PCR后处理这种方法是在进行PCR之前,在试管加样的同时加入补骨脂素衍生物-异补骨脂(AMDMIP)。异补骨脂不会产生干扰引物的退火和Taq酶的活性,而且也具有热稳性定性。PCR后,将反应管置于长波UV光下照射,UV穿透管壁,出于光化学反应激活异补骨脂,与产物DNA的嘧啶残基形成环丁烷缩合单体,如果作为PCR模板,Taq酶不能再在这些NDA上移动产生聚合酶作用,这些DNA与寡核苷酸探针杂交不受影响,仍能稳定杂交。异补骨脂光化学法与UNG酶法比较,潜在污染的PCR产物已处理,减少了加入污染DNA的风险,但高浓度异补骨脂抑制PCR,如果能找到更不耐热的UNG或更有亲合力的补骨脂素,会有较大的改善。
北京大学第一医院 朱 平
在聚合酶链反应(PCR)的方法建立以前,面院DNA长链上某种基因的变化有很大难度。1983年由Kry Mullis 等利用当时已经发现的DNA聚合酶,首先建立的体外DNA序列扩增法,基本方法是用寡核苷酸引物扩增位于两个已知序列之间的DNA序片段。反应在DNA聚合酶催化下完成。引物的序列分别与模板基因的序列互补,分别结合在模板DNA对应的两条单链的目的基因的两端随着引物序列从5’~3’延伸合成。在过量的两种引物的四种dTTP,dATP,dCTP,dGTP存在的情况下,模板ONA通过加热而变性,然后冷却到一定温度,两个引物退火,结合到了对应的模极序列上。DNA聚合酶使退火后结合在模板上的引物开始延伸。随后,反复重复变性,退火,DNA延伸等合成步骤。由于每一次扩增后的产物又可充当下一循环的模板,所以每一次循环基本上都能使靶DNA产物的量扩增一倍。1985年,Saiki用这种方法检测时常发生于非洲黑人中的镰刀红细胞贫血获得了成功。PCR从此进入实用阶段。由于PCR操作相对不很复杂,应用前景广阔,因此短短几年已经广泛渗透到医学各个阶段,发表论文和专著数以千计。
迄今各种PCR的实验方法虽然有一些改进变化,但是基本原理是一致的。PCR的主要产物是双链DNA,在目的基因两端设计了两条特异性的引物,引物的5’末端限定了扩增的目的序列的长度,其长度等于两引物间的距离。在PCR过程中,第一循环扩增产生的DNA大小是不均一的,其长度可以超出两个引物结合部位间距离。在第二循环后,以第一循环产物为模板所扩增出的DNA分子的长度便固定了,并在以后的循环中以成倍速度积累,成为PCR的产物尽管在每一循环中,以起始的DNA为模板所产生的较长片段的产物也仍在不断的扩增,但它们是以线性方式增加,因此对最终产物的影响不明显。
1983年设计的PCR操作是用E.olic DNA聚合酶的Klenow段催化延伸过程。由于这种酶在PCR变性时的高温下失活,所以在每一循环中的合成步骤之前,都需要加入新鲜的酶。耐热性Taq DNA聚合解决了这个问题。Taq聚合酶是从嗜热菌(Thermusaquaticus)中纯化出来的。可耐95℃的水浴温度,在变性步骤中不失活。因此不需要在每一循环后重新加入新鲜的酶。因为引物的退火和延伸可以在较高的温度广进行,引物的错误启动作用大大减少,从本质上改善了扩增反应的特异性、效率及扩增产物的长度。仅仅用0.5μg的模板DNA,经30~35周期的循环后,就可以获得0.5~1μg的靶序列DNA产物,序列长度可达12kb。
PCR在遗传性疾病的诊断,临床标本中病原体检查,法医学标本的遗学鉴定(来源于毛发或单个精细胞的DNA),分析被激活的痛基因的突变情况都有应用。这些应用都进于从PCR基本技术中扩展的一系列研究方法。这些方法已经作为各种分子克隆技术和DNA分析的基本技术,可以用于:1.用微卫星做染色体基因定位,寻找基因缺失。2.获得特异性序列基因表达生产蛋白或者作为分子探针。3.从微量mRNA中产生cDNA文库。已经发展了直接比较正常和遗传变异基因的方法。4.用于直接序列测定分析。5.获得基因片段分析基因突变,SSCP,DGGE,异源双链形成。目前已经用PCR做基因的定量分析。
一、用微卫星确定染色体的基因丢失
最近发现,用微卫星序列确定遗传性变异基因的存在与否和位置变化,足很有用的方式。微卫星(Microstellite)是广泛分布于不同染色体上的一些简单重复序列,通常由2~4个核苷酸反复重复排列组成。每个个体同一等位基因上这种序列重复的次数不同,故序列的长度不同,呈多态性。迄今已发现6000余个微卫星序列。自1992年起,法国人开始将微卫星序列作为标志物之一做基因图谱,将染色体上的基因划分开来,每个标志物之间的距离缩小到了1000kb,称为第二代基因图谱。近年人们利用微卫星序列研究遗传病基因的突变和丧失取得了很多进展,由于微卫星序列已被定位于各个染色体上,每条染色体可被微卫星分成若干区域,根据这些微卫星标记,可以将致病基因的位置定出并局限于最小范围。如果发现一个家系有2例同样一种遗传性疾病,就可以用微卫星序列做基因的连锁分析,定位克隆出未知的致病基因。与遗传有关的基因许多已经通过微卫星克隆或定位。寻找家族易感基因的基本方法是连锁分析(Linkage analysis)法,即在获得遗传性疾病的家系后,取得不同家族成员(包括正常人和患者)的血样品,提取DNA,以位于不同染色体位点的微卫星结构作为标志物,分析每个成员在不同位点的状态,比较同一位点上不同成员的状态,如果发现在同一位点上家族中患者总是共有同样的等位基因,则意味着该处可能存在致病基因,在相邻部位进一步取微卫星做上述研究,则可将基因定位并克隆。现在已经有现成的克隆基因的试剂盒,内容包括23对染色体上各10~20个微卫星位点的荧光标记引物,检测基因组200~400个基因定位点,如果发现哪些基因与患者表型连锁,就可以进一步做细致的定位克隆。
许多遗传病,肿瘤都发现存在微卫星序列的杂合性丢失(LOH)和不稳定性(MSI)现象。杂合性丢失(loss of heterozygosity,LOH)现象是来自父亲或母亲一方的等仪基因发生了缺失。如果发现某一肿瘤有许多病例孜某一染色体位点有较高的LOH发生率,往注标志这一位点存在这种肿瘤的抑癌基因。大约75%的大肠癌显示有染色体17p和18q的LOH,50%的大肠癌显示有5q的LOH,后来发现5q上的APC/MCC、17P上的p53以及18q上的DCC是抑癌基因。据报告5q21的LOH可发生在21%~40%的非小细胞肺癌、80%的小细胞肺癌以及77%的食管癌中。散发性大肠癌中DCC位点LOH的发生率为71%。消化道癌中有61%显示有DCC基因LOH,18q的LOH可出现在64%的骨肉瘤、60%的卵巢癌、33%的肾肿瘤、11%的肺癌。在散发性乳癌中,5q21(APC/MCC基因)的LOH发生率是28%;18q21(DCC基因)的LOH发生率是31%;17p13(P53基因)的发生率是71%,以上三个位点中,2个或2个以上位点发生LOH的几率是24%。
由于DNA错配修复(DNA mismatch repair)功能的损害所造成的DNA不稳定性也可能是遗传病和肿瘤产生的原因之一。不稳定性可表现在微卫星在DNA复制后出现长度的变化,即微卫星结构的不稳定性(Microstellite instability,MSI),这些长度的变化是由于细胞分裂时DNA复制过程中新合成的链在模板上沿复制方向向前或向后滑动所造成的,脆性X综合征,强直性肌营养不良等许多遗传病与基因不稳定有关。肿瘤只是瘤细胞出现变异,将同一病人的肿瘤及正常组织DNA进行微卫星结构的PCR扩增电泳,用肿瘤DNA所形成的区带与正常组织相比,如果肿瘤组织DNA可产生多余的条带,则表示肿瘤中存在遗传不稳定性或称修复错误(repair error,RER)。最早发现遗传性非息肉性大肠痈(hereditory non-polosis colorectal cancer,HNPCC)有MSI,近来在非遗传性大肠癌甚至其它肿瘤(包括胰腺癌,胃癌,乳腺癌,前列腺癌等)也发现MSI现象。在HNPCC中,MSI发生宰高达80%~90%,散发大肠癌发生率较低,为15~40%。在其它散发性癌中,胰腺癌MSI发生率较高(66.7%),留癌为38石%,但在低分化胃痫中高达64%。食管鳞癌3p微卫星MSI的发生率为60%。卵巢癌9q上一个位点以上MSI的发生率为59%,前列腺癌MSI的发生率为37.5%,低分化腺癌为63.6%,D期转移癌为46.7%,与高中分化癌有统计学差异。在非上皮肿瘤中MSI报合不多。MSI是出现在某些染色休上的某些基因还是影响所有的基因尚无定论。
微卫星作为多态性标记,因其在染色体上有明确的定位,可以广泛用于克隆新的遗传病相关基因和肿瘤的抑癌基因、预测发病趋势、评价治疗效果和估计预后,为基因在染色体细致定位提供了一个新工具。
二、PCR检测单核营酸多态性
人类基因组后计划除了研究基因组结构与功能以外,将以人类致病基因组和药物敏感基因组为研究的重点。研究致病和药物敏感性基因组不仅具有极其重要的理论价值,而且亦有十分重要的实际意义和社会经济效益,其中单核苷酸多态性(Single Nucleotide Polymorphism,SNP)的分析是主要的研究途径和方法。用单核苛酸多态性做基因分析是从1998年刚刚发展起来的,特指人类基因组中大量存在的单个核苷酸的变异。正常人不同个体的核苷酸序列都有一定的差异,它决定了不同人种和群体的差异,目前推断人基因组至少有30万个SNP,基因上每500bp~1000bp就有一个SNP。与所谓第二代基因图谱的微卫星串连重复序列相比,SNP是一个具有高度稳定性的遗传学标记,是一种新一代的人类基因标记。SNP不仅是人类种族和个体差异的标记,亦是决定不同人群疾病、易感性和药物治疗敏感性的标记,可以成为寻找疾病相关基因,进行疾病诊断、预防和药物筛选的基础。
目前SNP研究主要包括2个方面:一是确定人类究竟有多少SNP,从1999年的文献报告分析,多数研究上利用基因库资料和序列标签位点(STS)在不同染色体上分段工作,基本方法包括PCR直接扩增相关基因后测序,SSCP,异源双链分析,探针杂交,限制酶分析等,许多实验方法已经有了自动化仪器。为了加速进展,有些先进实验室开始利用基因芯片,一次分析更多的位点。在国际互连网络上已经建立了很多SNP网站供研究者查询和比较。二是直接利用一些患病家系,选择与该两致病有关的候选基因上的SNP做连锁分析。例如Halushka 1999年6月报告高血压病75个候选基因上874个候选SNP,认为一些SNP与发病有关;Mein 1998年报铅分析394个糖尿病家系的染色体6上的MHC附近候选致病基因和位于染色体10、16等上致病候选基因的SNP,通过SNP寻找致病基因。Becker l999年用SNP分析自身免疫病的候选基因,认为与补体C6、7、8无关。候选送因上的SNP均依据作者以往工作的经验或者通过计算机查询国际一些大基因库进行比较分析后选择。
三、定量PCR
在病毒所致的疾病,与基因表达剂量有关的遗传病以及肿瘤的微小残留病的检测中,要动态观测和分析患者体内的基因表达情况,及时了解病情的发展趋势,PCR的定量显得尤为重要。定量分析用PCR反应结束时的DNA含量来推测模板DNA的量,通常用正常稳定表达的基因如β-actin做内参标,因此进行这种分析是基于一个前提假设:混合反应体系内内参标和检测基因的扩增效率一致。在混合体系的PCR的反应中存在两种现象制约了扩增效率的一致性:短片段优先扩增和平台效应:由于达到扩增平台的时间很可能不一致,如一个片段已达到平台,而另一片段还能继续扩增,则此时终止反应,扩增效率必然不一致。因此要想定量尽量精确,必须满足一些条件,各条片段的长度不能有过大的差异,扩增时的循环次数不能过多。
一般说来,PCR反应体系里加入一对扩增看家基因(如:β-actin)的引物,然后对电泳胶银染,所得的图象扫描后用计算机进行处理,得到各个条带密度的相对数值,大致可反映体内各种基因所占的比例。此种方法的主要缺陷是无法克服PCR的平台效应。PCR产物行毛细管电泳后经计算机处理可行到代表不同DNA组份的峰,其峰下面积即为其含量的数值。这种方法比银染后扫描相对精确一些,其缺陷仍是无法克服PCR的平台效应。
荧光定量PCR最常用的荧光标记方法是用荧光标记引物的5’端,在反应过程中荧光素整合到PCR产物中,反应结束后可经电泳检测荧光强度,现在更常用全自动荧光DNA分析系统(如PE公司的373A或377)来自动分析。这种分析可以在反应进行中而不必等到反应完成后进行,在一定程度上克服了平台效应。国外已用于临床,国内由于其价格昂贵,尚未广泛应用。在混合DNA标本中各等位基因扩增效率相同的前提下,只要循环次数相对较少,PCR产物的量与模板DNA的含量之间存在线性关系。如果不同条带之间的扩增效率存在差异,则此线性关系就不精确,此时结果就需要校正。
四、常用的PCR其他方法
1.序列分析:序列分析的方法有Maxam-Gilbert化学裂解法和更常用的Sanger双脱氧末端终止法两种。PCR可产生用于Sanger序列分析的模板。PCR反应结束后,用微量浓缩器透析除去过量的dNTP和引物。用32P标记的新引物对扩增的DNA进行序列分析。扩增反应后残留的引物有可能干扰双脱氧核苷酸末端终止法测序反应。末标记的引物与标记的引物争夺PCR-DNA产物的的结合位点,并能延伸。为了去除这些与标记引物竞争的旧引物,可经先将扩增的DNA用凝胶电泳纯化,以避免这类问题。
2.突变分析:通过扩增产物的大小可以检测某一部位的缺失或插入。用带有缺失位点的引物进行PCR反应,如果扩增,便可推测有缺失存在。还可通过SSCP,放射性标记的RNA探针杂交,数种引物同时进行PCR等来检测点突变。
3.多重PCR:多重PCR(multiple PCR)是在一次反应中加入多种引物,同时扩增一份DNA样品中不同基因位点的不同序列。设计引物时使获得的产物序列的长短不同,有固定的大小。根据不同长短的序列在与否,检测是否有某些基因片段的缺失与突变。多重PCR常用于检测X-联锁遗传病杜氏肌营养不良的dystrophin蛋白的缺失。该基因的缺失集中于9个易发热点区,加人多种引物的反应液(多重PCR)扩增这些易缺失基因,电泳观察是否有一区带缺失,可以检测出80%以上的杜氏肌营养不良症。G-6-PD缺乏症是最常见的红细胞酶缺乏症,在我国南方有些省份G-6-PD活性降低者高达6%。中国台湾学者同时用8对引物扩增G-6-PD基因的第2~13外显子,然后克隆相应片段并测序,确定了4种点突变。一些多重PCR可以用特异性探针做DNA杂交,以确定PCR是否成功。
4.筑巢法PCR:筑巢法PCR(nested-primer PCR)是先用一对外侧引物扩增获得的基因的一些大片段,再用第二套内侧引物以大片段为模板再扩增。通常先用外侧引物扩增若干周期,再加入内侧引物,使PCR效率大大增加。一些治疗后的白血病血液和骨髓中残留白血病细胞仅占所有有核细胞中很小的比例,比如1%以下,相对异常基因拷贝数较少。筑巢法PCR可以提高PCR的效率和特异性,常常用于检测淋巴细胞白血病的免疫球蛋白基因重排;慢性粒细胞白血病的bcr/abl基因和早幼粒白血病的pml/RARα基因。一般用外侧引物扩增30周期,然后取出10%的反应产物放置新试管,新试管有全套反血液和新内侧引物,再扩增30周期。筑巢法所以用同位素探针检测,因为必须与4种引物结合才队获得阳性结果,因此特异性很强。
5.反向PCR:PCR可以扩增位于两引物之间的DNA片段,但用反向PCR(inverse PCR)可以扩增已知序列区间以外的序列。用限制性内切酶将基因组DNA完全消化,但目的序列上没有这个酶的切割位点,目的序列的片段通常短于2~3kb;然后稀释DNA,使其在适当的条件下连接成单环状。由于Taq DNA聚合酶对线状DNA的扩增效果较好,多数实验者选用仅在已知序列区内存在一个内切酶消化,使单环重新线性化。无论线状或环状模板,都可用与已知序列5’末端互补的引物,扩增已知序列以外的区域。扩增反应的主要产物是线状双链DNA,原先的已知序列分别为DNA的头一尾部的序列。其上、下游序列顶端的连接点是原先用于消化基因组DNA的P8’性内切酶的酶切位点。反向PCR用于快速扩增已知序列以外的未知DNA片段。因此,反向PCR可用于探索邻接已知序列的其他染色体序列。
6.双温PCR:双温PCR(two-temperature PCR)仅仅执行2步温度程序。标准PCR需要3步温度程序,第一步高温,使天然双链DNA热变性;第二步降温,使引物退火连接在和它互补的模板DNA上;第三步是中温,理论上这时引物延伸,合成新的互补DNA序列。实际上,只要有足够的超量的dNTP和退火的引物,Taq酶可以在温度升降过程中使引物延伸。如果仅仅合成35~100bp左右的序列,引物退火温度的要求范围可以高于或者低于理论温度5~10℃,引物浓度和Taq酶也不很要紧。合并退火与延伸温度,用双温PCR可能比用严格的温度更能提高反应速度和特异性。一般常用温度是94~95℃和46~47℃。
五、PCR操作中的污染
PCR强有力的地方恰巧也是它的弱点所在。由于PCR技术十分敏感,很可能在扩寸曾获得目的基因的同时,由于样本和扩增片段的蓄积,形成潜在的污染因素。通常典型的PCR反应可以产生1012扩增拷贝。因此,很小的一点雾状飞沫可以含有1015潜在的目的基因。有项研究发现,将100μl PCR产物放人一个奥大匹克标准化游泳池,那么每0.1ml的游泳池水中将含40个扩增产物分子。白血病的残留病以及一些感染性疾病诊断都需要最大的敏感性,要求能扩增少量样品DNA中1~10个模板分子。为了尽可能避免污染造成的假阳性,应当注意以下几个方面:(1)每次PCR都要设阶性和阴性对照。(2)将PCR和PCR后的操作分离进行。一定不要在加模板DNA的房间打开PCR后的反应管的盖。(3)用下压移液器和带过滤咀的移液器。(4)PCR反应试剂分成最小包装,每次分别使用,不重复用。(5)经常用紫外灯照射,破坏小DNA片段。较早进行PCR的实验室都遇到过了话染的问题,因此从开始就建立正确的操作程序,有利于今后的工作。然而,很多临床试验室受一定限制,没有一定的条件和空间防止污染。难以避免假阳性,一些新操作法可去除PCR产物的污染。一个是用酶学方法,一个是用光照方法。
用UNG做PCR前处理(酶学法)利用UNG的方法是在反应液中加入一种细菌的酶,叫N-糖基尿嘧啶酶(Uracil N glycosylase UNG)。这种酶能够切除连接碱基和磷酸糖基骨架间的N-糖基,因此能切去DNA的尿嘧啶。这种方法是在做PCR时,用dUTP代替dTTP,扩增产物中所有T的位置被取代。在下次PCR前,先加入UNG孵育,以前污染的含dUTP的PCR产物都被UNG酶降解,但不会影响正常DNA模板。UNG在94℃高温下灭活。应当强调指出,只有在一开始做PCR试验就采用这种方法才会有效,因为要求所有PCR产物都含dUTP。如果已经有某种PCR产物污染了实验室,再做同样的试验就无效了。
光化学法做PCR后处理这种方法是在进行PCR之前,在试管加样的同时加入补骨脂素衍生物-异补骨脂(AMDMIP)。异补骨脂不会产生干扰引物的退火和Taq酶的活性,而且也具有热稳性定性。PCR后,将反应管置于长波UV光下照射,UV穿透管壁,出于光化学反应激活异补骨脂,与产物DNA的嘧啶残基形成环丁烷缩合单体,如果作为PCR模板,Taq酶不能再在这些NDA上移动产生聚合酶作用,这些DNA与寡核苷酸探针杂交不受影响,仍能稳定杂交。异补骨脂光化学法与UNG酶法比较,潜在污染的PCR产物已处理,减少了加入污染DNA的风险,但高浓度异补骨脂抑制PCR,如果能找到更不耐热的UNG或更有亲合力的补骨脂素,会有较大的改善。